Академический Документы
Профессиональный Документы
Культура Документы
objetos
11.2
La prdida de datos en caso de fallo de alimentacin o por fallo del sistema Fallo fsico del dispositivo de almacenamiento Almacenamiento voltil: Se pierde el contenido cuando se apaga el equipo. Almacenamiento no voltil:
Contenido persistente incluso cuando se apaga el equipo. Incluye almacenamiento secundario y terciario, as como copia de seguridad.
11.3
Acceso rpido (10s a 100s de nanosegundos; 1 nanosegundo = 109 segundos) Demasiado pequea (o demasiado cara) para almacenar una base de datos completa. Voltil contenido de la memoria se pierde si la fuente de poder falla o problemas con el sistema.
11.4
Los datos sobreviven a la falta de energa Los datos pueden escribirse una vez, pero no se pueden sobrescribir de manera directa.
11.5
El almacenamiento en disco resiste los fallos del suministro elctrico y las cadas del sistema.
11.6
Los datos se almacenan pticamente en el disco y se leen mediante un laser. La mas popular forma de discos pticos es: CD-ROM (640 MB) y DVD (4.7 a 17 GB)
11.7
No voltil, utilizado inicialmente para copia de seguridad Acceso secuencial mas lento que los discos Capacidad elevada (40 a 300 GB) Removibles de la unidad de lectura Los jukeboxes disponibles para grandes cantidades de datos
Cientos de terabytes (1 terabyte = 109 bytes) o tambin petabyte (1 petabyte = 1012 bytes)
Datos
satelitales.
11.8
Jerarqua de almacenamiento
11.9
memoria principal).
Almacenamiento secundario: El siguiente nivel de la
11.10
Discos magnticos
Se mantienen tan prximas como sea posible a la superficie de los discos para aumentar la densidad de grabacin. Lee o escribe magnticamente informacin codificada Encima de los 50K-100K pistas por plato para un disco tpico Un sector es una pequea unidad de datos donde podemos leer o escribir Tamao tpico de un Sector es 512 bytes Tpicamente la cantidad de sectores por pista es: 500 (en las pistas internas) a 1000 (en las pistas externas)
11.12
Subsistema de disco
de bsqueda (4 10 ms.).
Velocidad de transferencia de datos (25-100 MB/s) Fiabilidad (tiempo medio entre fallos): 500,000 1200,00o horas. (57 136 aos)
Database System Concepts - 5th Edition, Oct 23, 2005. 11.14 Silberschatz, Korth and Sudarshan
el sistema de archivos como el gestor de la memoria virtual de los sistemas operativos. Los datos se transfieren por bloques de sectores. Algunas tcnicas para mejorar el acceso a los bloques son:
Planificacin del brazo del disco (ej. Algoritmo del ascensor). Organizacin de archivos. Memoria intermedia de escritura no voltil (NV-RAM) Disco de registro histrico (utilizados en sistemas de archivos de diario)
11.15
RAID
Para conseguir mayor rendimiento y fiabilidad
se han propuesto varias tcnicas de organizacin de los discos denominadas colectivamente disposicin redundante de discos independientes: RAID. Aunque existen seis niveles distintos de RAID, los niveles ms comnmente usados son:
11.16
introducir la redundancia. Cada unidad lgica puede tener 2 unidades fsicas. Cada operacin de escritura se realiza por duplicado. El tiempo medio entre fallos (prdida de datos) de un disco con imagen depende del tiempo medio entre fallos de cada disco y del tiempo medio de reparacin (sustitucin del disco averiado).
11.17
con varios discos distribuyendo los datos entre ellos. Se puede dar:
de discos = n El bloque lgico i se almacena en el disco fsico (i mod n)+1, en el bloque fsico (i/n).
En un sistema de discos, el paralelismo busca: Equilibrar la carga de varios accesos de pequeo tamao. Convertir en paralelos los accesos de gran tamao.
11.18
correccin de errores. No incorpora redundancia de datos. Mejor rendimiento de lectura y escritura. No proporciona tolerancia a fallas. Mnimo 2 discos. Toda la capacidad del disco se emplea. No es verdaderamente un RAID, no tiene integridad de datos. Un error en un disco implica perdida de toda la data. Se utiliza donde sea ms importante el rendimiento que la seguridad (edicin, produccin de videos, imgenes, cualquier comunicacin que requiera ancho de banda).
11.19
conjunto de datos en dos o ms discos (array). Resulta til cuando el rendimiento en lectura es ms importante que la capacidad y tambin desde el punto de vista de la seguridad. Diseado para sistemas en donde la disponibilidad de informacin es esencial y su reemplazo resultara difcil y costoso.
11.20
usa un cdigo de Hamming para la correccin de errores. Permite tasas de trasferencias extremadamente altas.
Se emplea para mejorar de demanda y tambin la velocidad
de transferencia.
Podemos recuperar los datos gracias a los discos de cdigo de
error.
11.21
bytes con un disco de paridad dedicado. Permite un menor nmero de operaciones de E/S por segundo, ya que todos los discos tienen que participar en cada solicitud de E/S, por lo cual no es adecuado para operaciones concurrentes. Resultan mas adecuados para sistemas en los que transfieren grandes cantidades de datos secuencialmente , ejemplo audio y video.
11.22
independientes con disco de control de errores. Usa divisin a nivel de bloques con un disco de paridad dedicado. El RAID 4 es parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a nivel de bytes. Esto permite que cada miembro del conjunto funcione independientemente cuando se solicita un nico bloque. La operacin de escritura se realiza en forma secuencial y la lectura en paralelo.
11.23
independientes con integracin de cdigo de error mediante paridad distribuida. Usa divisin de datos a nivel de bloques. Distribuye informacin de paridad entre todos los discos. El RAID 5 ha logrado popularidad gracias a su bajo coste de redundancia. Generalmente, el RAID 5 se implementa con soporte hardware para el clculo de la paridad. Se necesita un mnimo de tres unidades.
11.24 Silberschatz, Korth and Sudarshan
RAID 6: Independent Data disks with two independent distributed parity schemes
Sistemas independientes de
disco con integracin de cdigo de error mediante una doble paridad . Conocido como esquema de redundancia P+Q. Es esencialmente una extensin del RAID 5 , para ello guarda , una segunda paridad. No solamente se puede recuperar un error de entre dos discos , sino que es posible recuperar muchos errores de 3 discos.
11.25
RAID anidados Los RAIDs anidados se indican normalmente uniendo en un slo nmero los correspondientes a los niveles RAID usados, aadiendo a veces un + entre ellos. Por ejemplo, el RAID 10 ( RAID 1+0) consiste conceptualmente en mltiples conjuntos de nivel 1 almacenados en discos fsicos con un nivel 0 encima, agrupando los anteriores niveles 1.
11.26
divisiones
RAID 10: Una divisin de
espejos
RAID 30: Una divisin de
11.27
11.28
Los
El El
11.30
Aspectos hardware
RAID se puede implementar como:
intercambio en caliente.
disco o la interconexin del sistema pueden ser el punto de fallo que detiene el funcionamiento de un sistema RAID.
31
Database System Concepts - 5th Edition, Oct 23, 2005. 11.31 Silberschatz, Korth and Sudarshan
Acceso al almacenamiento
Cada base de datos se corresponde con
elementos de datos que viene determinado por la forma de organizacin fsica de los datos que se utilice.
11.32
La memoria intermedia
Un objetivo del SBD es minimizar el
nmero de transferencias de bloques entre el disco y la memoria. La memoria intermedia (buffer) es la parte de la memoria principal disponible para el almacenamiento de las copias de los bloques del disco. El subsistema responsable de la asignacin del espacio de la memoria intermedia se denomina gestor de la
memoria intermedia.
11.33
Estrategia de sustitucin
Bloques clavados: Para que el sistema de bases de datos pueda recuperarse de las cadas resulta necesario limitar las ocasiones en que se puede volver a escribir el bloque en el disco. Se dice que un bloque al que no se le permite que se vuelva a escribir en el disco est clavado. Salida forzada de bloques: Hay situaciones en las que resulta necesario volver a escribir el bloque en el disco, aunque no se necesite el espacio de memoria intermedia que ocupa. Este proceso de escritura se denomina salida forzada del bloque.
El contenido de la memoria intermedia se pierde en las cadas, mientras que los datos del disco suelen sobrevivir a ellos.
11.34
bloques de la memoria intermedia es la minimizacin de los accesos al disco. Suposicin para sustituir un bloque: es probable que se vuelva a hacer referencia a los bloques a los que se ha hecho referencia recientemente. Por tanto, si hay que sustituir un bloque, se sustituye el bloque al que se ha hecho referencia menos recientemente. Este enfoque se denomina esquema de sustitucin de bloques LRU (Least Recently Used). los sistemas operativos utilizan la pauta anterior de las referencias a los bloques como forma de predecir las referencias futuras.
No resulta posible predecir con precisin los bloques a los que se har referencia.
11.35
predecir la pauta de referencias futuras con ms precisin que los sistemas operativos. Los SO confan en el pasado para predecir el futuro; los SBD pueden tener informacin relativa al futuro a corto plazo.
Las peticiones de los usuarios al SBD
comprende varias etapas. El SBD suele determinar con antelacin los bloques que se necesitarn examinando cada una de las etapas necesarias para llevar a cabo la operacin solicitada por el usuario.
Database System Concepts - 5th Edition, Oct 23, 2005. 11.36 Silberschatz, Korth and Sudarshan
Ejemplo
Consideremos la siguiente operacin del lgebra
relacional:
prestatario |X| cliente
Supngase que la estrategia para procesar la
11.37
que MRU funcione correctamente, el sistema debe clavar el bloque de cliente que se est procesando.
11.38
bloques de disco.
Existen diversas maneras de
nmero-cuenta: char(10);
estructura. Se debe rellenar el espacio ocupado por el registro que hay que borrar con algn otro registro del archivo o tener algn medio de marcar los registros borrados para que puedan pasarse por alto. A menos que el tamao de los bloques sea un mltiplo de cuarenta (lo que resulta improbable) algunos de los registros se saltarn los lmites de los bloques. Es decir, parte del registro se guardar en un bloque y parte en otro. Harn falta, por tanto, dos accesos a bloques para leer o escribir ese tipo de registros.
Database System Concepts - 5th Edition, Oct 23, 2005. 11.41 Silberschatz, Korth and Sudarshan
Tipos
Tipos
11.43
Utilizacin del espacio dejado por un registro borrado. Gran cantidad de fragmentos de disco desaprovechados.
No queda espacio para el aumento de tamao de registros (campos variables), lo cual ocasiona desplazamiento fsico del registro.
11.44
2.
11.45
almacenan datos que pueden ser mucho ms grandes que los bloques del disco.
Las BD Relacionales suelen limitar el
Espacio reservado
11.47
b.
11.48
c.
11.49
Cualquier registro en cualquier parte del archivo Los registros no se ordenan Un archivo por cada relacin
Registros guardados de manera secuencial segn el valor de la clave de bsqueda Se calcula una funcin de asociacin para algn atributo de cada registro que indica el bloque del archivo donde se debe colocar el registro
11.50
atributo.
Los registros se vinculan mediante
punteros.
Los registros se guardan fsicamente
ordenada. Resulta difcil mantener el orden fsico secuencial por el costo de desplazamiento de varios registros. Para la insercin se aplican las siguientes reglas:
Localizar el registro que precede al que se va a insertar segn el orden de la clave de bsqueda. Si existe algn espacio libre dentro del mismo bloque, el nuevo registro se insertar ah. Caso contrario se inserta en un bloque de desbordamiento. Luego de insertar, ajustar los punteros.
11.52
Clave de bsqueda
Este enfoque funciona bien si hay que guardar un nmero relativamente pequeo de registros en los bloques de desbordamiento. Cuando se pierde la correspondencia entre el orden de la clave de bsqueda y el fsico, el archivo debe ser reorganizado.
Database System Concepts - 5th Edition, Oct 23, 2005. 11.53 Silberschatz, Korth and Sudarshan
pequeos que pueden organizar un archivo por cada relacin con los servicios del SO.
Muchos SBD de gran tamao no utilizan
11.54
55
Relacin: Impositor
Relacin: Cliente
select nmero-cuenta, nombre-cliente, calle-cliente, ciudad-cliente from impositor, cliente where impositor.nombrecliente = cliente.nombrecliente
Database System Concepts - 5th Edition, Oct 23, 2005. 11.55
Estructura de archivo eficiente para consultas que involucren a Impositor |X| Cliente
Silberschatz, Korth and Sudarshan
56
agrupaciones de varias tablas es una organizacin de archivos que almacena registros relacionados de dos o ms relaciones en cada bloque.
Este tipo de organizacin de archivos
permite leer registros que satisfacen la condicin de reunin en un solo proceso de lectura de bloques.
Database System Concepts - 5th Edition, Oct 23, 2005. 11.56 Silberschatz, Korth and Sudarshan
de consultas, como:
Select * from Cliente
Para encontrar todas las tuplas de la relacin cliente, se pueden enlazar todos los registros de esta relacin mediante punteros.
57
Database System Concepts - 5th Edition, Oct 23, 2005. 11.57 Silberschatz, Korth and Sudarshan
sobre las relaciones, como puede ser su esquema. Esta informacin se denomina diccionario de datos o catlogo del sistema. Contiene, entre otras cosas:
El nombre de las relaciones El nombre de los atributos de cada relacin. El dominio y la longitud de los archivos. El nombre y la definicin de las vistas. Restricciones de integridad.
11.58
Datos de usuario
Nombre
Autorizacin
cuentas.
Contraseas
de almacenamiento utilizado para cada relacin (Ej. con agrupaciones o sin agrupaciones)
11.59 Silberschatz, Korth and Sudarshan
(secuencial, asociativa o en montculos) de las relaciones y la ubicacin donde se guarda cada relacin:
Si las relaciones se guardan en archivos del SO, el diccionario guarda los nombres y direcciones de los archivos. Si la BD almacena todas las relaciones en un solo archivo, el SBD puede guardar los bloques que contienen los registros a travs de estructuras de datos, como por ejemplo, las listas.
60
11.60 Silberschatz, Korth and Sudarshan
Nombre del ndice Nombre de la relacin para la que se crea. Atributos sobre los que se define. Tipo de ndice formado.
Metadatos-relacin = (nombre-relacin, nmero-atributos) Metadatos-atributos = (nombre-atributo, nombre-relacin, tipodominio, posicin, longitud) Metadatos-usuarios = (nombre-usuario, contrasea-cifrada, grupo) Metadatos-ndices = (nombre-ndice, nombre-relacin, tipo-ndice, atributos-ndice) Metadatos-vistas = (nombre-vista, definicin)
Base de datos de los metadatos del sistema
61
Database System Concepts - 5th Edition, Oct 23, 2005. 11.61 Silberschatz, Korth and Sudarshan