Вы находитесь на странице: 1из 25

UNIVERSIDAD PRIVADA DEL SUR DE MXICO

INFORMTICA III

ISC. Y MT. GUILLERMO SANTOS HERNNDEZ

UNIDAD I

GUILLERMO ABRAHAM BALLINAS CAPITO

3 A

TUXTLA GUTIRREZ, CHIAPAS; A 15 DE JUNIO DE 2013

NDICE

INTRODUCCIN

1. ESTRUCTURA JERRQUICA

2. TERMINOLOGA

3. ORGANIZACIN DE ARCHIVOS

4. MANTENIMIENTO DE ARCHIVO

5. ARCHIVOS SECUENCIALES

6. ARCHIVOS INDEXADOS

7. TRATAMIENTO DE COLISIONES

8. ACCESO A ARCHIVOS DIRECTOS MEDIANTE INDEXACIN

CONCLUSIN

BIBLIOGRAFA

INTRODUCCIN

EN ESTA PRIMERA UNIDAD DE INFORMTICA BSICA III, ANALIZAREMOS LA ESTRUCTURA JERRQUICA DE UNA BASE DE DATOS; ES DECIR DE LAS PARTES QUE LO COMPONEN, Y SU SIGNIFICADO DE CADA UNA DE ELLAS. TAMBIN SABREMOS PAR QUE SIRVE CADA UNO DE ELLOS, COMO SE TRABAJA, COMO SE MODIFICAN, COMO SE BORRAN, COMO SE CREAN INCLUSO; ENTRE OTRAS COSAS, QUE NOS SERVIRN EN OTRO MOMENTO PARA CREAR BASES DE DATOS EN EXCEL O ACCESS. INCLUSO HAY UN APARTADO EN TODO ESTE RESUMEN QUE HABLA SOBRE LOS ALGORITMOS PARA PODER CREAR ARCHIVOS, PARA PODER MODIFICARLOS, ETC.

1. ESTRUCTURA JERRQUICA Los conceptos de carcter, campo, registro, archivo y base de datos son conceptos lgicos que se refieren al medio en que el usuario de computadoras ve los datos y se organizan. Las estructuras de datos se organizan de un modo jerrquico, de modo que el nivel ms alto lo constituye la base de datos y el nivel ms bajo el carcter. Ejemplo: estructura jerrquica de Datos.

a) CAMPOS Los caracteres se agrupan en campos de datos. Un campo es un tem o elemento de datos elementales, tales como un nombre, nmero de empleados, ciudad, nmero de identificacin, etc. Un campo est caracterizado por su tamao o longitud y su tipo de datos (cadena de caracteres, entero, lgico, etc.). Los campos pueden incluso variar en longitud. En la mayora de los lenguajes de programacin los campos de longitud variable no estn soportados y se suponen de longitud fija. Un campo es la unidad mnima de informacin de un registro. Los datos contenidos en un campo se dividen con frecuencia en subcampos. Ejemplo: Campos de un registro. Nombre Direccin Fecha Nacimiento de Estudios Salario

b) REGISTROS Un registro es una coleccin de informacin, normalmente relativa a una entidad particular. Un registro es una coleccin de campos lgicamente relacionados que pueden ser tratados como una unidad por algn programa. Los registros pueden ser todos de longitud fija; por ejemplo, los registros de empleados pueden contener el mismo nmero de campos, cada uno de la misma longitud para nombre, direccin, fecha, etc. Tambin pueden ser de longitud variable.

N= Longitud de registro c) ARCHIVOS (FICHEROS) Un archivo o fichero de datos es una coleccin de registros relacionados entre s con aspectos en comn y organizados para un propsito especfico. Por ejemplo un archivo de una clase escolar contiene un conjunto de registros de los estudiantes de esa clase. Un archivo en una computadora es una estructura diseada para contener datos, estos estn organizados de tal modo que puedan ser recuperados fcilmente, actualizados o borrados y almacenados de nuevo en el archivo con todos los cambios realizados.

d) BASE DE DATOS Una coleccin de archivos a los que puede accederse por un conjunto de programas y que contienen todos ellos datos relacionados, constituye una base de datos. 2. TERMINOLOGA a) Clave Una clave (key) o indicativo es un campo de datos que identifica al registro y lo diferencia de otros registros. Esta clave debe ser diferente para cada registro. Claves tpicas son nombres o nmeros de identificacin. b) Registro fsico o bloqueo Un registro fsico o bloque es la cantidad ms pequea de datos que pueden transferirse en una operacin de entrada/salida entre la memoria central y los dispositivos perifricos o viceversa. Ejemplos de registros fsicos son: una lnea de impresin, un sector de un disco magntico, etc. Un bloque puede contener uno o ms registros lgicos. c) Factor de bloqueo Otra caracterstica que es importante en relacin con los archivos es el concepto de factor de bloqueo. El nmero de registros lgicos que puede contener un registro fsico se denomina factor de bloqueo. Ejemplo: Factor de bloqueo - un registro por factor de bloque.

- N registro por bloque (factor= N)

Se pueden dar las siguientes situaciones: Registro lgico > Registro fsico. En un bloque que contienen varios registros fsicos por bloque; se denominan registros expandidos. Registro lgico = Registro fsico. El factor de bloqueo es 1 y se dice que los registros no estn bloqueados. Registro lgico < Registro fsico. El factor de bloqueo es mayor que 1 y los registros estn bloqueados. 3. ORGANIZACIN DE ARCHIVOS El soporte es el medio fsico donde se almacenan los datos. Los tipos de soporte utilizados en la gestin de archivos son: Soportes secuenciales Soportes direccionables

Los soportes secuenciales son aqullos en los que los registros informaciones estn escritos unos a continuacin de otros y para acceder a un determinado registro, n se necesita pasar por los n-1 registros anteriores. Los soportes direccionables se estructuran de modo que las informaciones registradas se pueden localizar directamente por su direccin y no se requiere pasar por los registros precedentes. Segn las caractersticas del soporte empleado y el modo en que se han organizado los registros, se consideran dos tipos de acceso a los registros de un archivo: Acceso secuencial Acceso directo

El acceso secuencial implica el acceso a un archivo segn el orden de almacenamiento de sus registros, uno tras otro. El acceso directo implica el acceso a un registro determinado, sin que ello implique la consulta de los registros precedentes. Este tipo de acceso slo es posible con soportes direccionables. La organizacin de un archivo define la forma en la que los registros se disponen sobre el soporte de almacenamiento, o tambin se define la organizacin como la forma en que se estructuran los datos en un archivo. En general, se consideran tres organizaciones fundamentales: a) Organizacin secuencial Un archivo con organizacin secuencial es una sucesin de registros almacenados consecutivamente sobre el soporte externo, de tal modo que para acceder a un registro n dado es obligatorio pasar por todos los n-1 artculos que le preceden.

Los registros se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando se leen dichos registros.

b) Organizacin directa Un archivo est organizado en modo directo cuando el orden fsico no se corresponde con el orden lgico. Los datos se sitan en el archivo y se accede a ellos directa aleatoriamente mediante su posicin, es decir, el lugar relativo que ocupan. Las condiciones para que un archivo sea de organizacin directa son: Almacenado en un soporte direccionable. Los registros deben contener un campo especfico denominado clave que identifica cada registro de modo nico; es decir, dos registros distintos no pueden tener un mismo valor de clave. Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el soporte.

c) Organizacin secuencial indexada Un diccionario es un archivo secuencial, cuyos registros son las entradas y cuyas claves son las palabras definidas por las entradas. Para buscar una palabra (una clave) no se busca secuencialmente desde la a hasta z, sino que se abre el diccionario por la letra inicial de la palabra. Por consiguiente, cada archivo secuencialmente-indexado consta de un archivo ndice y un archivo de datos. Un archivo est organizado en forma secuencialindexada si: El tipo de sus registros contiene un campo clave identificador Los registros estn situados en un soporte direccionable por el orden de los valores indicados por la clave Un ndice para cada posicin direccionable, la direccin de la posicin y el valor de la clave; en esencia, el ndice contienen la clave del ltimo registro y la direccin de acceso al primer registro del bloque.

Operaciones sobre archivos. Las distintas operaciones que se pueden realizar a los registros de un archivo son: a) Creacin de un archivo Es la primera operacin que sufrir el archivo de datos. Implica la eleccin de un entorno descriptivo que permita un gil, rpido y eficaz tratamiento del archivo. b) Consulta de un Archivo Es la operacin que permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos los registros. c) Actualizacin de un archivo Es la operacin que permite tener actualizado (puesto al da) el archivo, de tal modo que sea posible realizar las siguientes operaciones con sus registros: Consulta del contenido de un registro. Insercin de un registro nuevo en el archivo. Supresin de un registro existente Modificacin de un registro d) Clasificacin de un Archivo Una operacin muy importante en un archivo es la clasificacin u ordenacin (sort, en ingls). Esta clasificacin se realizar de acuerdo con el valor de un campo especfico, pudiendo ser ascendente (creciente) o descendente (decreciente): alfabtica o numrica.

e) Reorganizacin de un archivo La reorganizacin suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener una nueva estructura lo ms ptima posible. f) Destruccin de un archivo Es la operacin inversa a la creacin de un archivo (kill, en ingls). Cuando se destruye (anula o borra) un archivo, ste ya no se puede utilizar y por consiguiente no se podr acceder a ninguno de sus registros. g) Reunin, fusin de un archivo Reunin: Esta operacin permite obtener un archivo a partir de otros varios. Fusin: Se realiza una fusin cuando se renen varios archivos en uno solo, intercalndose unos en otros, siguiendo unos criterios determinados. h) Rotura/ estallido de un archivo Es la operacin de obtener varios archivos a partir de un mismo archivo inicial.

4. MANTENIMIENTO DE ARCHIVO. La operacin de mantenimiento de un archivo incluye todas las operaciones que sufre un archivo durante su vida y desde su creacin hasta su eliminacin o borrado. El mantenimiento de un archivo consta de dos operaciones diferentes: -Actualizacin: La actualizacin es la operacin de eliminar o modificar los datos ya existentes, o bien introducir nuevos datos. En esencia, es la puesta al da de los datos del archivo. Las operaciones de actualizacin son: Altas Bajas Modificaciones - Consultas: Las operaciones de consulta tienen como finalidad obtener informacin total o parcial de los datos almacenados en un archivo y presentarlos en dispositivos de salida: pantalla o impresora, bien como resultados o como listados.

* Altas: Una operacin de alta en un archivo consiste en la adicin de un nuevo registro. En un archivo de empleados, un alta consistira en introducir los datos de un nuevo empleado. El algoritmo del subprograma ALTAS debe contemplar la comprobacin de que el registro a dar de ALTA no existe previamente. * Bajas: Una baja es la accin de eliminar un registro de un archivo. La baja de un registro se puede presentar de dos formas distintas: indicacin del registro especfico que se desea bajar o bien visualizar los registros del archivo para que el usuario elija el registro a borrar. La baja de un registro puede ser lgica o fsica. Una baja lgica supone el no borrado del registro en el archivo. Una baja fsica implica el borrado y desaparicin del registro de modo que se crea un nuevo archivo que no incluye al registro dado de baja. * Modificaciones: Una modificacin es un archivo consiste en la operacin de cambiar total o parcialmente el contenido de uno de sus registros. Esta fase es tpica cuando cambia el contenido de un determinado campo de un archivo; por ejemplo, la direccin o la edad de un empleado. * Consulta: La operacin de consulta tiene como fin visualizar la informacin contenida en el archivo. Los aspectos ms interesantes a tener en cuenta son: Opcin de visualizacin en pantalla o listado en impresora Detencin de la consulta a la voluntad del usuario. Listado por registros o campos individuales o bien listado total del archivo.

* Operaciones sobre Registros: Las operaciones de transferencia de datos a/o desde un dispositivo a la memoria central se realizan mediante las instrucciones: Leer nombre archivo, lista de entrada de datos Escribir nombre archivo, lista de salida de datos Las operaciones de acceso a un registro y de paso de un registro a otro se realizan con las acciones leer y escribir. 5. ARCHIVOS SECUENCIALES En un archivo secuencial los registros se insertan en el archivo en orden cronolgico de llegada al soporte, es decir, un registro de datos se almacena inmediatamente a continuacin del registro anterior. Los archivos secuenciales terminan con una marca final de archivo (FF o EOF). Cuando se tengan que aadir registros a un archivo secuencial se aadirn en las marcas fin de archivos. Las operaciones bsicas que se permiten en un archivo secuencial son: escribir su contenido, aadir un registro al final del archivo y consultar sus registros. Las dems operaciones exigen una programacin especfica. Los archivos secuenciales son los que ocupan menos memoria y son tiles cuando se desconoce a priori el tamao de los datos y se requieren registros de longitud variable.

CREACIN La creacin de un archivo secuencial es un proceso secuencial, ya que los registros se almacenan consecutivamente en el mismo orden en que se introducen en el archivo. La operacin de crear un archivo tiene dos variantes: * Crear el archivo original (1); * Aadir datos al archivo ya creado y a continuacin del ltimo registro del mismo (2) La creacin del archivo requerir los siguientes pasos: - Abrir el archivo; - Leer datos del registro; - Grabar registro; - Cerrar archivo. En los archivos secuenciales EOF o FF es una funcin lgica que toma el valor cierto si se ha alcanzado el final del archivo y falso en caso contrario. El algoritmo de creacin con inclusin del men de opciones es el siguiente:

CONSULTA El proceso de bsqueda o consulta de una informacin en un archivo de organizacin secuencial se debe efectuar obligatoriamente en modo secuencial. As, para el caso de un archivo de n registros, el nmero de lecturas de registros efectuadas son: Mnimo 1, si el registro buscado es el primero del archivo; Mximo n, si el registro buscado es el ltimo o no existe dentro del archivo. El tiempo de acceso ser influyente en las operaciones de lectura/escritura. La bsqueda en lugar de ser secuencial se podra realizar por el mtodo binario, lo que reducir considerablemente en tiempo. El algoritmo de consulta de un archivo requerir un diseo previo de la presentacin de la estructura de registros en el dispositivo de salida de acuerdo al nmero y longitud de los campos.

En el caso de bsqueda de un determinado registro con un campo clave x, el algoritmo de bsqueda se puede modificar en la siguiente forma con:

ACTUALIZACIN. La actualizacin de un archivo supone: Aadir nuevos registros (altas) Modificar registros ya existentes (modificaciones) Borrar registros (bajas)

* Altas La operacin de dar de alta un determinado registro es similar a la operacin ya descrita anteriormente de aadir datos a un archivo.

La operacin de alta supone la creacin nueva del archivo, ya que un archivo secuencial no admite la incorporacin de nuevos registros.

* Bajas Existen dos mtodos para dar de baja a un registro: 1. Se utiliza un archivo transitorio 2. Almacenar en un array (vector) todos los registros del archivo, sealando con un indicador o bandera (flag) el registro que se desea dar de baja. Mtodo 1 Se crea un segundo archivo auxiliar, tambin secuencial, copia del que se trata de actualizar. Se lee el archivo completo registro a registro y en funcin de su lectura se decide si el registro se debe de dar de baja o no. Si el registro se va a dar de baja, se omite la escritura en el archivo auxiliar o transitorio. Si el registro no se va a dar de baja, este registro se escribe en el archivo auxiliar. Tras terminar la lectura del archivo original, se tendrn dos archivos: original (o maestro) y auxiliar. El proceso de bajas del archivo concluye cambiando el nombre del archivo auxiliar por el de maestro y borrando previamente el archivo maestro original. Mtodo 2 Este procedimiento consiste en sealar los registros que se desean dar de baja con un indicador o bandera; estos registros no se graban en el nuevo archivo secuencial que se crea sin los registros dados de baja.

MODIFICACIONES El proceso de modificacin de un registro consiste en localizar este registro, efectuar dicha modificacin y a continuacin rescribir el nuevo registro en el archivo. El proceso es similar al de bajas:

6. ALGORITMO PARA MANIPULAR ARCHIVOS INDEXADOS. Los archivos aleatorios o de acceso directo tienen una gran rapidez de acceso comparados con los secuenciales; son fciles de referenciar nmero de orden del registro, y la facilidad de mantenimiento. La lectura/escritura de un registro es rpida, ya que se accede directamente al registro y no se necesita recorrer los anteriores. Operaciones con archivos de acceso directo Las operaciones con archivos de acceso directo son las usuales ya vistas anteriormente: * Creacin El proceso de creacin de un archivo directo o aleatorio consiste en ir introduciendo los sucesivos registros en el soporte que los va a contener y en la deteccin obtenida resultante del algoritmo de conversin. Si al introducir un registro se encuentra ocupada la direccin, el nuevo registro deber ir a la zona de sinnimos o de excedentes.

Altas: Para dar de alta un registro, se debe introducir su nmero de orden y contenido.

Consulta: El proceso de consulta de un archivo o aleatorio es rpido y debe comenzar con la entrada del nmero o nmeros de registros a consultar. Las operaciones a realizar son:

Bajas: Para realizar una baja se toma un campo indicador en el que su valor sea 0, y cuando exista, se pone a 1. Este tipo de una baja lgica, que significa que, pese a usar un registro dado de baja, sigue ocupando el mismo espacio que si estuviera presente.

Modificaciones: En un archivo aleatorio se localiza el registro que se desea modificar nmero de registro; se modifica el contenido y se reescribe:

7. MTODOS DE TRATAMIENTO DE COLISIONES La eleccin de un mtodo adecuado para resolver colisiones es tan importante como la eleccin de una buena funcin hash. Cuando la funcin hash obtiene una misma direccin para dos claves diferentes, se est ante una colisin. Algunos mtodos ms utilizados para resolver colisiones son los sigs.: Reasignacin Arreglos anidados reas de desborde Reasignacin Existen varios mtodos que trabajan bajo el principio de comparacin y reasignacin de elementos. Se analizaran tres de ellos: Prueba lineal Prueba cuadrtica Doble direccin hash a) Prueba lineal Consiste en que una vez detectada la colisin se debe de recorrer el arreglo secuencialmente a partir del punto de colisin, buscando al elemento. El proceso de bsqueda concluye cuando el elemento es hallado, o bien cuando se encuentra una posicin vaca. Se trata al arreglo como a una estructura circular: el siguiente elemento despus del ltimo es el primero.

b) Prueba Cuadrtica Este mtodo es similar al de la prueba lineal. La diferencia consiste en que en el cuadrtico las direcciones alternativas se generan como D + 1, D + 4, D + 9,. . ., D + i en vez de D + 1, D + 2,..., D + i. Esta variacin permite una mejor distribucin de las claves colisionadas. A continuacin se presenta un ejemplo que ilustra el funcionamiento:

C) Doble direccin hash Consiste en que una vez detectada la colisin se debe generar otra direccin aplicando la funcin hash a la direccin previamente obtenida. El proceso se detiene cuando el elemento es hallado, o bien cuando se encuentra una posicin vaca. D = H (K) D' = H (D) D'' = H (D') La funcin hash que se aplique a las direcciones puede o no ser la misma que originalmente se aplic a la clave. No existe una regla que permita decidir cul ser la mejor funcin a emplear en el clculo de las sucesivas direcciones.

Arreglos anidados Este mtodo consiste en que cada elemento del arreglo tenga otro arreglo en el cual se almacena los elementos colisionados. Si bien la solucin parece ser sencilla, es claro tambin que resulta ineficiente. Encadenamiento Consiste en que cada elemento del arreglo tenga un apuntador a una lista ligada, la cual se ira generando e ira almacenando los valores colisionados a medida que se requiera. 8. ACCESO A ARCHIVOS DIRECTOS MEDIANTE INDEXACIN. Recordando que los archivos de organizacin secuencial indexada contienen dos reas: un rea de datos que agrupa a los registros y un rea ndice que contiene los niveles de ndice. Pueden contener tambin una zona de desbordamiento o excedentes para caso de actualizaciones. Una de las grandes ventajas de utilizar un ndice con un archivo de datos secuenciales es que la adicin de registros pueden realizarse mucho ms rpidamente que con un archivo datos clasificados, siempre que el ndice sea pequeo para poder alojarse en memoria. El almacenamiento del rea de ndices en memoria, mientras el programa se ejecuta, permite encontrar los registros por clave ms rpidamente con un archivo indexado que con uno clasificado, ya que la bsqueda binaria puede ejecutarse completamente en memoria.

En este tipo de organizacin de archivos se dispone de una tabla en que aparecen ordenados secuencialmente los nmeros de la clave del archivo y asociados a cada uno de ellos de da la direccin del registro correspondiente.

C O N C L U S I N. ESTA UNIDAD ABARCO TODO LO RELACIONADO A LA BASE DE DATOS Y SUS COMPONENTE. SE OBSERVA TAMBIEN EL SIGNIFICADO DE CADA COSA, PAR QUE SIRVE, QUE SE PUEDE HACER CON ELLA, ES DECIR; COMO MANIPULARLA. TAMBIEN SE MENIONA LA PARTE DE LOS ALGORITMOS DE ARCHIVOS SECUENCIALES E INDEXADOS, QUE ESO SINCERAMENTE NO ENTENDI. TAMBIEN VIENE QUE ES LO QUE SE HACE EN CASO DE COLISIONES Y PORQUE SE MANIFIESTA. Y FINALMENTE SE HABLA TAMBIEN SOBRE EL MANTENIMIENTO DE ARCHIVOS, COMO LO ES: LA ACTUALIZACIN LA BAJA LA ALTA LAS MODIFICACIONES LS CONSULTAS, ENTRE OTRAS COSAS.

BIBLIOGRAFA http://fcasua.contad.unam.mx/apuntes/interiores/docs/98/3/informatica3.pdf

http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Administracion_Archivos/Apuntes/Colisiones .PDF

Вам также может понравиться