Вы находитесь на странице: 1из 27

mailxmail - Cursos para compartir lo que sabes

Procesamiento de datos con Oracle


Autor: Hernan Alberto Silva Rodrguez

mailxmail - Cursos para compartir lo que sabes

Presentacin del curso


Curso para aprender desde qu son los datos hasta cmo se transforman en informacin con la ayuda de un gestor de base de datos como Oracle. Disfruta de las herramientas que te ofrece este programa.

mailxmail - Cursos para compartir lo que sabes

1. Introduccin
Historia del procesamiento de datos Qu es lo que en todas partes del mundo se produce a cada instante y por todas las personas al mismo tiempo? Te has puesto a pensar que cuando entras a un cajero automtico a realizar un retiro de dinero, ests efectuando un procesamiento de datos?. El procesamiento de datos, ha existido siempre. Inicialmente fue manual. Posteriormente se convirti en mecnico cuando Blas Pascal, en el siglo XVIII, dise la mquina para calcular libras esterlinas, a partir de peniques y chelines, mquina que en su honor recibi el nombre de "Pascalina". Con el descubrimiento de la energa elctrica, por parte de Benjamn Franklyn, y su posterior utilizacin, este procesamiento de datos pas a convertirse en electromecnico, hasta que slo a mediados del presente siglo, con la realizacin de lo que en 1.822 haba idealizado en su proyecto conocido como la mquina analtica, Charles Babbage, se logr por parte de Presper Eckert y John McAushly en la Universidad de Pennsylvania, EE.UU., la construccin del primer computador para el procesamiento electrnico de datos, conocido con el nombre de ENIAC ( Electronical Numerical Integrator and Calculator). De este modo, observamos cmo a travs de la historia, la humanidad ha necesitado de herramientas que ayuden a realizar sus tareas de procesamiento de datos. Y, Porqu es importante el procesamiento de datos? Es importante el procesamiento de datos porque sin esta actividad no existiran sistemas de informacin. Un sistema de informacin est compuesto por tres elementos que confluyen en un sistema para el procesamiento de datos, a saber: El soporte humano (Humanware), el soporte lgico (Software) y el soporte fsico (Hardware). El soporte humano, es el conjunto de personas que se encarga de la recoleccin e introduccin de los datos y controlan el procesamiento de datos hasta la produccin y almacenamiento de la informacin. Este personal adems es el responsable de la produccin y evaluacin del soporte lgico para el funcionamiento del soporte fsico, adems del mantenimiento y administracin de ste ltimo. El software a su vez, consiste fundamentalmente de tres niveles: 1. 2. El software funcional u operativo El software traductor y,

El software aplicativo. En el software aplicativo es donde se encuentran todas las instrucciones que la mquina ejecuta con la ayuda del hardware para efectuar el procesamiento de datos requerido. A este nivel pertenece ORACLE. Estas instrucciones pueden estar almacenadas en un programa que puede haber sido desarrollado en un lenguaje de programacin para computadoras como el Lenguaje C, por ejemplo, convirtindose

mailxmail - Cursos para compartir lo que sabes


ste en lo que denominamos el software traductor. Finalmente este programa utiliza los datos que se le digitan a la computadora por algn dispositivo de entrada, controlado por el sistema operativo, para que sean almacenadas en memoria y luego en las denominadas bases de datos.

mailxmail - Cursos para compartir lo que sabes

2. Datos
QU SON LOS DATOS? Son las unidades elementales para la produccin de la informacin. Los datos son la materia prima de los sistemas de procesamiento de datos que sirven de apoyo a los sistemas de informacin. Funcionalmente, los datos son el registro de los hechos. Tericamente podemos afirmar que los datos son identificadores de entidades y atributos de manera cualitativa y cuantitativa. Entidades a su vez son personas, animales, vegetales, organizaciones, instituciones o cosas de las cuales podemos decir algo, colocarles atributos o caractersticas distintivas de entre los dems elementos similares o de su clase. As por ejemplo, una persona como entidad tiene un nombre, "Hernn", tiene una edad, 38 aos, tiene un peso, 70 Kg, etc. Los datos estn compuestos por unidades ms sencillas conocidas en nuestro nivel como caracteres e interpretadas al nivel de la mquina como Bytes. Un dato puede estar constitudo por uno o ms caracteres, como por ejemplo en el caso de algunos formatos el sexo se marca con un "M" o con una "F" para indicar masculino o femenino, respectivamente. Los caracteres pueden ser: alfabticos, numricos o simblicos, como por ejemplo: {+},-?, etc. Cada uno de estos caracteres que puede ser representado en la computadora por un arreglo de ocho bits, un Byte, tiene un nico cdigo de representacin organizado y reconocido por el Cdigo Normalizado Americano para Intercambio de Informacin ( American Standard Code for Information Interchange) internacionalmente reconocido como cdigo ASCII. El cdigo ASCII adems de asociar a cada carcter un cdigo nico tambin proporciona un cdigo nico a las seales de transmisin, entre los dispositivos de los equipos de computacin y comunicacin, como lo son por ejemplo: ENTER, ESC, TAB, BAKSPACE, etc.

mailxmail - Cursos para compartir lo que sabes

3. Proceso
CMO SE TRANSFORMAN LOS DATOS EN INFORMACIN? Los datos se transforman en informacin til para el usuario mediante las funciones del procesamiento de datos que a travs de la historia como se describi, han sido y an siguen siendo concurrentemente manuales, mecnicas, electromecnicas y electrnicas capitalizadas hoy por hoy, por las mquinas prodigiosas a travs de operaciones de captura, organizacin, clasificacin y ordenamiento, clculos matemticos, almacenamiento y recuperacin, transmisin, reproduccin, distribucin y comunicacin. PROCESAMIENTO DE DATOS El procesamiento de datos consiste en el registro de los hechos, actividades, clculo y en general, eventos en forma de datos, con el fin de transformarlos en informacin til para el usuario final. Estos pueden ser: Alfabticos Numricos Simblicos Grficos Elementos multimediatizados

El procesamiento de datos solo es posible mediante el uso de aplicaciones realizadas en software traductor. El Software traductor nos provee el conjunto de programas que nos ayudan a efectuar las operaciones bsicas del procesamiento de datos ya descritas. Estos son los llamados lenguajes de programacin. Entre los lenguajes mas importantes se destaca el Lenguaje C, en el cual estn desarrolladas la gran mayora de aplicaciones comerciales genricas, como las desarrolladas por los programadores de aplicaciones de las empresas fabricantes de Software.

mailxmail - Cursos para compartir lo que sabes

4. Informacin
Definimos la Informacin, como una forma significativa para el receptor y su valor es percibido, en acciones prospectivas o en las decisiones". En otras palabras, podemos afirmar que la "Informacin es toda forma de comunicacin como resultado de un procesamiento de datos". La funcin primordial de la informacin consiste en aumentar el conocimiento del usuario, o lo que puede llegar a ser igual, en reducir su incertidumbre o minimiza r la posibilidad de riesgo. 4.1 Utilidad de la Informacin La informacin es considerada en la actualidad, el segundo activo ms importante dentro de las organizaciones, superado solamente por el talento humano. En general, toda informacin resulta importante dentro de un contexto especfico de la toma de decisiones, se puede decir, que la informacin que no sirve para tomar decisiones carece de valor. Por otro lado, la utilidad de la informacin es relativa a ciertas caractersticas que debe poseer, de las cuales podemos citar: exactitud, oportunidad y relevancia. La exactitud, se refiere a la precisin y calidad de la informacin. La informacin ser til en tanto se encuentre libre de errores, libre de desviaciones y libre de manipulacin (voluntaria o involuntaria) por parte de las personas involucradas. La oportunidad, implica que la informacin deber llegar en el momento apropiado a la persona indicada, en otras condiciones puede perder su utilidad. Por ltimo, la relevancia, establece que la informacin de los datos apropiados para resolver la necesidad para la cual fue descrita. Esta relevancia depender del usuario final de la misma y el propsito para el cual ser empleada. Otras caractersticas que se deberan considerar cuando se habla de informacin son: Claridad: Dependiendo de la claridad con que se exprese la informacin, esta podr cumplir o no su propsito. Precisin: Para determinados casos, se requiere mayor o menor precisin de los datos, sin embargo, la intencin es que la informacin que se obtenga maneje el mayor grado de precisin posible. La precisin tiene una relacin directa con los instrumentos que se emplean para tomar los datos. Orden: Para propsitos diferentes, se requiere orden diferente de los datos, de manera tal que logren el objetivo. Presentacin: En ocasiones la forma en que se presentan los datos es esencial para el cumplimiento del propsito de la informacin. Los cuadros, tablas, grficos estadsticos o resmenes, resultan de mayor utilidad para toma de decisiones que los informes de 50 pginas donde se detallan todas las cifras. 4.2 Aspectos econmicos de la informacin

La seleccin del mtodo de procesamiento de datos mas adecuado para una aplicacin u organizacin especficas exige que el analista de sistemas conozca a

mailxmail - Cursos para compartir lo que sabes


aplicacin u organizacin especficas exige que el analista de sistemas conozca a fondo tanto las necesidades de procesamiento como las posibilidades de cada uno de los mtodos. Puede afirmarse que las necesidades de procesamiento estn determinadas por las consideraciones siguientes: El volumende los datos involucrados La complejidadde las operaciones de procesamiento Las limitaciones impuestas al tiempode procesamiento y, Las demandas de clculo

El conocimiento de las posibilidades es igualmente importante cuando se elige un mtodo de procesamiento de datos, entre los cuales se incluyen los siguientes quince factores: 1. Inversin inicial. Es el costo de adquisicin de los materiales y mquinas que se requieren para el procesamiento. 2. Preparacin. Es el gasto que implica preparar inicialmente los datos obtenidos para el procesamiento subsecuente. 3. Conversin. Es el costo nico del procesamiento inicial de los datos mediante el nuevo mtodo. 4. Personal especializado. El nivel de conocimientos y capacitacin de las personas que tendrn a su cargo el procesamiento. 5. Costo variable. Es el costo de una unidad de datos en relacin con los cambios ocurridos en su volumen. 6. Modularidad. La posibilidad de aumentar o disminur la capacidad de procesamiento de acuerdo con las necesidades. 7. Flexibilidad. Es la posibilidad de modificar el sistema de procesamiento para hacer frente a nuevas demandas o cambios presentados en el entorno. 8. Versatilidad. Es la posibilidad de llevar a cabo muchos procesos diferentes.

9. Velocidad de procesamiento. El tiempo necesario para convertir los datos en informacin 10. Poder de clculo. La posibilidad de realizar operaciones matemticas complejas. 11. Control del procesamiento. La posibilidad de poder controlar que cada una de las tareas se lleva a cabo conforme a lo planeado. 12. Deteccin automtica de errores. La posibilidad de detectar errores de procesamiento, por cada una de las partes del sistema. 13. Poder de decisin. La capacidad de elegir entre alternativas para seguir con el procesamiento. 14. Alteracin del sistema. El grado en que el sistema de procesamiento pierde eficacia, debido a la falla de alguno de sus componentes.

mailxmail - Cursos para compartir lo que sabes


15. 4.3 Nivel de automatizacin. El grado de automatizacin del sistema. Costo de la informacin

El costo de la informacin puede alcanzar entre el 15 y el 20 % del costo total de las operaciones de una empresa. Sin embargo, en algunas organizaciones como las financieras este costo puede elevarse hasta un 50%. Los costos de operacin del sistema de informacin se identifican del modo siguiente: 1. Costo del equipo. Costo fijo o perdido que aumenta con los niveles de automatizacin 2. Anlisis, diseo e implementacin del sistema. Costo fijo que aumenta con los niveles de mecanizacin. Incluye la metodologa para los procedimientos generales de procesamiento de datos. 3. Costo del espacio y del control de los factores ambientales. Costo semivariable. Aqu se incluye el costo de las instalaciones, aire acondicionado, unidades de control y regulacin de energa, seguridad, etc. 4. Costo de conversin. Costo fijo que incluye toda clase de cambios en el hardware. 5. Costos de operacin. Costo variable que comprende los costos del personal, suministros, servicios y mantenimiento de los equipos.

mailxmail - Cursos para compartir lo que sabes

5. Informtica
Acorde con todo lo anterior, definimos la Informtica "como la ciencia que tiene por objeto propio de su conocimiento la informacin; como mtodo, la teora general de sistemas a travs del anlisis de sistemas; como instrumento operativo, la computacin; como entorno de desarrollo, la organizacin; como objetivo, la racionalizacin, la eficacia y la eficiencia en la accin, a partir del control del proceso de produccin y circulacin de informacin; como misin, la de contribur a la libertad del ser humano y a la consolidacin de la democracia y como valor, la informacin misma como un bien econmico". La informtica existe, opera, se desarrolla y cumple un papel no solo como elemento nuevo en el proceso de produccin y circulacin de bienes, favoreciendo y fortaleciendo el sistema econmico, poltico y social en el que se da, sino que tambin aparece como un factor que introduce distorsiones en las estructuras sociales, mxime cuando en la prctica concreta es un factor determinante en el proceso de toma de decisiones, adoptando una funcin de poder instrumental. La Informtica pretende aportar soluciones a los mayores problemas de manejo y control que plantea una sociedad cada da mas compleja. Pretende adems resolver las trabas de produccin y circulacin de informacin. Todo ese campo propio de la Informtica, con base en su papel en la esfera de lo econmico, ha constitudo lo que podramos llamar la industria de la informacin. El trmino Informtica se creo en Francia en 1962 bajo la denominacin Informatique y precede de la contraccin de las palabras INFORmacin autoMTICA. En pocas palabras, podemos afirmar que la Informtica es la ciencia que estudia el tratamiento automtico y racional de la Informacin.

10

mailxmail - Cursos para compartir lo que sabes

6. Software
Para comprender claramente el procesamiento de datos, debe tomarse en cuenta su incorporacin en el proceso de desarrollo de sistemas de informacin, por ello, en esta seccin, se intentar dar un esbozo general de los pasos que constituyen el desarrollo de sistemas de informacin, y por ende, de software, no sin antes intentar una clasificacin del mismo. 6.1 CLASIFICACIN DEL SOFTWARE El software se clasifica en tres niveles, a saber: Software funcional Software traductor Software aplicativo

6.1.1 Software funcional Est compuesto por el conjunto de programas que sirven para hacer funcional el computador por lo que tambin recibe el nombre de software operativo. ste ha venido evolucionando a travs de las distintas generaciones de computadores, arrancando con el CPM, Control Program Monitor como un incipiente sistema operativo que despus dio origen al popular DOS, Disk Operative System, sistema operativo de disco que en la actualidad se volvi transparente para el usuario desprevenido, que utiliza sus comandos a travs del puntero del ratn de su computador. Es decir, en estos momentos la interfaz grfica que nos provee el Windows Windowscomo sistema operativo por excelencia nos brinda una comodidad en el manejo del computador que es imperceptible que este sistema se apoye implcitamente en el sistema DOS. La competencia en la actualidad para este sistema operativo la ofrece elLinux, un sistema operativo que se apoya en la versin anterior del mismo Unix, hecho en lenguaje C. Desde el punto de vista del control de los recursos de una computadora podemos definir el sistema operativo como el subsistema administrador para alcanzar un eficaz rendimiento de los recursos ofrecidos por el hardware. Estos recursos son los siguientes: El procesador, la memoria interna, la entrada / salida y la informacin. 6.1.2 Software traductor Est compuesto por todos los programas denominados lenguajes de programacin y a su vez se clasifican en: Lenguajes de bajo nivel o de mquina Lenguajes intermedios o ensambladores y, Lenguajes de alto nivel Los lenguajes de mquina constituyeron los lenguajes primera generacin, es decir los lenguajes que debieron usar los primeros programadores quienes usaron las mquinas de primera generacin de computadoras. Los lenguajes de segunda generacin, fueron los ensambladores, con el cual an algunos expertos programadores hacen cdigo, el tradicional ASSEMBLER.

11

mailxmail - Cursos para compartir lo que sabes


Los primeros lenguajes de alto nivel, orientados al usuario fueron los de tercera generacin, entre los que se destacan el FORTRAN, el COBOL, el BASIC, el LOGO y el ADA, lenguajes estos que dieron origen al paradigma de programacin imperativo, junto con el ALGOL 68, PL/1, RPG, PASCAL, C y MODULA. Los lenguajes de cuarta generacin, orientados y constituyendo bsicamente el paradigma de programacin de gestin y manejo de bases de datos, donde aparecen el NATURAL, CSP, SAS, FOCUS y el SQL.

Los lenguajes de quinta generacin, aparecen los del paradigma de programacin lgica o leng lgica o lenguajes declarativos, como el LISP, el PROLOG, orientados a la inteligencia artificial y al procesamiento del lenguaje natural, adems de los lenguajes visuales lenguajes visuales y los orientados a objetos como el VISUAL BASIC, el C++, el , SMALLTALK y los lenguajes de hipertextos para Internet, como el HTML y el JAVA++ 6.1.2.1 Lenguajes interpretados Histricamente han existido desde la codificacin en sistema numrico binario, con las inmensas mquinas de primera generacin, pasando por el lenguaje Ensamblador (Assembler), en los denominados lenguajes de "bajo nivel" u orientados a la interpretacin por parte de la computadora, hasta los lenguajes interpretados por nosotros los humanos en idioma Ingls, en contraposicin denominados de "alto nivel". En esta categora se incluyen al LOGO, como lenguaje interpretador ideado por Seymour Papert y Jean Peaget, para el desarrollo de la programacin por los nios, orientado por una tortuga quien ejecuta las rdenes del nio. Tambin se incluye en esta categora el lenguaje BASIC (Beginers All-purpose Simbolic Instruction Code) Lenguaje de instrucciones simblicas de propsito general para principiantes. Este lenguaje tuvo su mayor florecimiento con el advenimiento de las microcomputadoras a finales de la dcada de los sesentas (60s). El lenguaje vena generalmente, incorporado dentro del sistema operativo de disco (DOS), de la computadora y era muy sencillo de aprender a programar con l. 6.1.2.2 Lenguajes compilados Sin embargo, entre los lenguajes de alto nivel los compilables han sido los de mayor importancia en el ambiente de programacin mismo. As tenemos que, en su orden el primer lenguaje usado por las universidades para el fin, fue el FORTRAN (FORmula TRANslation), o traductor de frmulas, de carcter cientfico. Debido a sus restricciones en el manejo de archivos comerciales se cre posteriormente el lenguaje COBOL (COmmon Business Oriented Language), lenguaje orientado a los negocios comunes. Eran los lenguajes de segunda generacin despus del Assembler. Despus cuando aparecieron los conceptos de programacin estructurada, surgi el lenguaje denominado Pascal, en honor al famoso matemtico francs, y finalmente el paradigma de la programacin declarativa-imperativa ha sido cubierto por el lenguaje "C", que es entre los lenguajes de alto nivel el considerado la frontera con los lenguajes de mquina, en el cual se han escrito cientos de miles de aplicaciones famosas incluyendo el Lotus, el Dbase, el Office completo, incluyendo el ACCESS y el mismo Clipper. 6.1.3 Software Aplicativo

El tercer nivel del software es el conformado por los paquetes de aplicacin. Este nivel a su vez se divide en cinco categoras, a saber: Procesamiento de documentos

12

mailxmail - Cursos para compartir lo que sabes


Clculo electrnico Graficacin Gestin de bases de datos y Comunicaciones entre redes locales y extensas

6.1.3.1 Procesadores de textos Consiste del conjunto de aplicaciones para desarrollar documentos de texto como cartas, conferencias, memorias y en general todo tipo de composiciones en las que el software provee al usuario todas las posibilidades para hacer un proceso perfecto de edicin, antes de la impresin final. Es el grupo de aplicaciones mas populares, que empezaron en nuestro medio con el famoso WORDSTAR, DISPLAY WRITE, WORD PERFECT, MICROSOFT WORD, MULTIMATE y LOTUS AMI PRO, entre los mas conocidos en el mercado. 6.1.3.2 Gestores de clculo electrnico Las hojas de clculo electrnico consisten en ficheros o tablas de doble entrada que permiten establecer campos en columnas y registros por filas que pueden ser utilizados para todo tipo de operaciones contables, estadsticas y en general funciones matemticas, para todo tipo de organizacin. Entre estos se han destacado desde el MULTIPLAN, pasando por el SUPERCALC, hasta llegar al LOTUS 123, QUATTRO y el reciente MICROSOFT EXCEL. 6.1.3.3 Graficadores Los grficos usados con una computadora pueden ser de dos tipos: de mapas de bits y vectoriales. Grficos de mapas de bits (bitmap). Tambin llamados grficos de puntos o de pxeles, se representan internamente con el conjunto de puntos que conforman la imagen. Hay que tener en cuenta que para su manejo y almacenamiento, cada punto es un elemento de informacin compuesto por sus coordenadas (posicin) junto con su color (o intensidad de grises), y un grfico de resolucin media consta de alrededor de medio milln de puntos. Se utilizan a menudo para, a partir de una imagen obtenida mediante Scanner, retocarla, colorearla, sombrearla, etc. Grficos vectoriales. Se representan internamente con la funcin geomtrica correspondiente a la figura. Tiene mejor calidad de presentacin, permitiendo modificaciones en sus proporciones, cambio de escala, desplazamientos, giros, ajustes, etc., por los que son los grficos usados en las aplicaciones de diseo asistido por computadora(CAD), entre los cuales el mas popular es el AUTOCAD y ltimamente una versin suya denominada INTELLICAD. Dentro de la gran cantidad de software existente para grficos, un grupo muy importante lo constituyen las aplicaciones de grficos estadsticos o grficos de gestin, cuyas posibilidades estn limitadas bsicamente a la obtencin de las grficas usadas en los documentos y presentaciones del mbito empresarial, incluyendo los diagramas de barras, poligonales y de sectores. Normalmente estas aplicaciones tienen la posibilidad de comunicarse con otras (hojas de clculo, base de datos, etc.), de donde obtienen los datos cuya representacin grfica se desea, e incluso en muchos casos van integrados con

13

mailxmail - Cursos para compartir lo que sabes


dichas aplicaciones. Son aplicaciones grficas comerciales, entre otras, POWER POINT, HARVARD GRAPHICS, PAINTBRUSH Y CORELDRAW. 6.1.3.4 Gestores de bases de datos El concepto de base de datos ser tratado en el Captulo 7, as que nos ocuparemos aqu de exponer brevemente las caractersticas del software estndar desarrollando al efecto para computadoras personales. Se denomina sistema de gestin de bases de datos (SGBD), o simplemente gestor de base de datos, a una aplicacin que permite manejar un conjunto grande de datos organizados en archivos e interrelacionados entre s. Un archivo estar formado por un nmero variable de registros, cada uno de los cuales contendr una informacin individual mediante un nmero predeterminado de campos. La gran importancia que tiene la localizacin y el rpido acceso a cualquiera de los registros a partir del valor de uno de sus campos hace que sea fundamental una buena organizacin y un buen sistema de acceso. De los modelos de bases de datos existentes, el que mas xito ha alcanzado, y especialmente en las aplicaciones de microcomputadores, es el modelo relacional, en el cual la informacin est organizada en forma de tabla o relacin. Pertenecen a este tipo de aplicaciones que iniciaron con el DBASE II, III+, IV, PARADOX, MICROSOFT ACCESS y ORACLE, que es la aplicacin que se manejar al final del presente curso. Hoy por hoy incursionana en este campo los gestores de bases de datos relacionales extendidos, que incluyen la posibilidad de vinculacion de objetos multimediales como imagenes y videos tendiendo a lo que posiblemente se convierta en el paradigma de las bases de datos orientadas a objetos, de las cuales ya existen varios productos comerciales, ganando cada da mas adeptos. 6.1.3.5 Gestores de comunicaciones Para establecer las comunicaciones entre las computadoras adems de las redes telefnicas, de microondas o satelitales, stas necesitan poseer un mdem y el software especfico que, de acuerdo con los protocolos definidos, permita el establecimiento de la conexin y su mantenimiento hasta que se concluya con el proceso de comunicacin completo. Un paquete de software de comunicaciones esta compuesto de un conjunto de programas que hace que los problemas de transmisin de datos sean transparentes para el usuario, proporcionndole un entorno amigable sin requerimientos tcnicos en la materia. Las posibilidades que se ofrecen entre otras, son: Conexin remota entre computadoras Acceso a bases de datos Correo electrnico Operaciones entre bancos

14

mailxmail - Cursos para compartir lo que sabes


Intercambio de documentos entre empresas Entre las aplicaciones ms comerciales se encuentran CARBON COPY, LAPLINK, COMMWORKS y los navegadores comerciales que permiten accesar a Internet como NESCAPE NAVIGATOR y MICROSFT EXPLORER 6.1.3.6 Paquetes integrados Un paquete de software integrado es el conjunto formado por varias aplicaciones relacionadas entre si, que constituyen una unidad operativa, generalmente con una aplicacin en cada uno de los anteriores gestores ofimticos (de la oficina moderna). Algunos de los paquetes integrados mas conocidos son: ASSISTANT, FRAME WORK, OPEN ACCESS, SIMPHONY, SMARTWARE, WORKS y el popular MICROSOFT OFFICE.

15

mailxmail - Cursos para compartir lo que sabes

7. Bases de Datos
A lo largo de la historia el trmino Bases de Datos ha tenido mltiples interpretaciones, desde los aos 60s cuando se acu el trmino. Algunas definiciones comunes son: "Coleccin de datos interrelacionados almacenados en conjunto sin redundancias perjudiciales o innecesarias; su finalidad es servir a una aplicacin o ms, de la mejor manera posible; los datos se almacenan de modo que resulten independientes de los programas que los usan; se emplean mtodos bien determinados para incluir nuevos datos y para modificar o extraer los datos almacenado" (Martin, 1975). "Coleccin o depsito de datos, donde los datos estn lgicamente relacionados entre s, tienen una definicin y descripcin comunes y estn estructurados de una forma particular. Una base de datos es, tambin, un modelo del mundo real y, como tal, debe poder servir para toda una gama de usos y aplicaciones" (Conferencia des Statisticiens Europens, 1977)". "Conjunto de datos de la empresa memorizado por un ordenador, que es utilizado por numerosas personas y cuya organizacin est regida por un modelo de datos" (Flory, 1982). "Conjunto estructurado de datos registrados sobre soportes accesibles por ordenador para satisfacer simultneamente a varios usuarios de forma selectiva y en tiempo oportuno" (Delobel, 1982). "Coleccin no redundante de datos compartibles entre diferentes sistemas de aplicacin" (Howe, 1983). "Coleccin integrada y generalizada de datos, estructurada atendiendo a las relaciones naturales de modo que suministre todos los caminos de acceso necesarios a cada unidad de datos con objeto de poder atender toda las necesidades de los diferentes usuarios". (Deen, 1985) "Conjunto de ficheros maestros, organizados y administrados de una manera flexible de modo que los ficheros puedan ser fcilmente adaptados a nuevas tareas imprevisibles" (Frank, 1988). "Coleccin de datos interrelacionados" (Emasri y Navathe, 1989).

Una definicin generalizante pudiera ser: " Coleccin o depsito de datos integrados, con redundancia controlada y con una estructura que refleje las interrelaciones y restricciones existentes en el mundo real; los datos, que han de ser compartidos por diferentes usuarios y aplicaciones, deben mantenerse independientes de stas, y su definicin y descripcin, nicas para cada tipo de datos, han de estar almacenadas junto con los mismos. Los procedimientos de actualizacin y recuperacin, comunes y bien determinados, habrn de ser capaces de conservar la integridad, seguridad y confidencialidad del conjunto de datos" 7.1 Objetivos de las bases de datos El hecho de emplear sistemas de bases de datos, busca unos objetivos especficos

16

mailxmail - Cursos para compartir lo que sabes


El hecho de emplear sistemas de bases de datos, busca unos objetivos especficos que podemos enumerar de la siguiente forma: Los datos podrn utilizarse de mltiples maneras. Se proteger la inversin intelectual. Bajo Costo. Menor proliferacin de datos. Desempeo. Claridad. Facilidad de uso. Flexibilidad. Rpida atencin de interrogantes no previstos. Facilidad para el cambio. Precisin y coherencia. Reserva. Proteccin contra prdida o dao. Disponibilidad.

Para lograr el cumplimiento de los anteriores objetivos, se tienen algunos secundarios como los siguientes: Independencia fsica de los datos. Independencia lgica de los datos. Redundancia controlada. Adecuada rapidez de acceso. Adecuada rapidez de exploracin. Normalizacin de los datos dentro de un organismo. Diccionario de datos. Interface de alto nivel con los programadores. Lenguaje de usuario final. Controles de integridad. Fcil recuperacin en caso de fallo. Afinacin. Ayudas para el diseo y la supervisin. Migracin reorganizacin automtica.

17

mailxmail - Cursos para compartir lo que sabes


7.2 Ventajas del Empleo de Bases de Datos De los Datos Independencia de stos respecto de los tratamientos y viceversa. Mejor disponibilidad de los mismos. Mayor eficiencia en la recogida, codificacin y entrada al sistema.

De Los Resultados Mayor coherencia Mayor valor informativo Mejor y ms normalizada documentacin de la informacin

De Los Usuarios Acceso ms rpido y sencillo de los usuarios finales. Ms facilidades para compartir los datos por el conjunto de los usuarios. Mayor flexibilidad para atender a demandas cambiantes.

7.3 Inconvenientes del empleo de Bases de Datos De la Implantacin Costosa en equipo (fsico y lgico) Ausencia de Estndares Larga y difcil puesta en marcha Rentabilidad a mediano plazo

RIESGO DE FRUSTRACCION De los Usuarios Personal especializado Desfase entre teora y prctica

7.4 ARQUITECTURA La arquitectura de la base de datos se basa en el estndar dado por ANSI/SPARC que se divide en 3 niveles (interno, conceptual y externo). 7.4.1. Nivel externo Es el nivel ms cercano al usuario, describe la parte que interesa al usuario especfico, por cada programa se debe especificar un esquema externo o subesquema o vista externa, para el acceso a la base de datos. Un usuario puede acceder a varios esquemas externos y un esquema externo ser compartido por muchos usuarios. Se considera una forma o vista abstracta, en una vista externa se puede:

18

mailxmail - Cursos para compartir lo que sabes


Omitir uno o ms campos Aadir mas campos (operador con los de la base) Omitir uno o ms registros Cambiar el orden de los registros Cambiar el orden de los campos Cambiar el tipo de los campos

7.4.2 Nivel conceptual En el cual se describe cuales son los datos reales de la base y que relaciones existen entre los datos. Este nivel contiene la base de datos en trminos de unas relaciones sencillas. Estas simples estructuras del nivel conceptual pueden estar reflejadas en complicadas estructuras fsicas. Este es el nivel empleado por el administrador de la base de datos. Contiene: Datos que definen los campos, atributos de los objetos. Datos compuestos que agrupan campos para las entidades.

Datos compuestos que reagrupan campos para describir asociaciones en le mundo real. Reglas a seguir de los datos. Relaciones entre los datos para relacionar registro de archivos mltiples.

Este nivel mantiene igualmente la seguridad de los datos. 7.4.3 Nivel interno No es precisamente el nivel fsico. En este se describen cmo estn almacenados los datos realmente: Archivos, registros, rutas de acceso, ndices, orden de almacenamiento. Un registro interno o fsico es diferente de uno lgico. La operacin de transformar registros lgicos en fsicos y viceversa se llama transformacin de datos o mapeo En un DBMS deben existir: reglas para la correspondencia interno-conceptual y reglas para la correspondencia conceptual por cada esquema externo, estas reglas de correspondencia las da el administrador.

19

mailxmail - Cursos para compartir lo que sabes

8. Sistema Manejador de Base de Datos


8.1 Definicin El sistema de gestin de bases de datos es esencial para el adecuado funcionamiento y manipulacin de los datos contenidos en la base. Se puede definir como: "El Conjunto de programas, procedimientos, lenguajes, etc. que suministra, tanto a los usuarios no informticos como a los analistas, programadores o al administrador, los medios necesarios para describir, recuperar y manipular los datos almacenados en la base, manteniendo su integridad, confidencialidad y seguridad". 8.2Funciones Las funciones esenciales de un SGDB son la descripcin, manipulacin y utilizacin de los datos. Descripcin: Incluye la descripcin de: Los elementos de datos, su estructura, sus interrelaciones, sus validaciones. Tanto a nivel externo como lgico global e interno esta descripcin es realizada mediante un LDD o Lenguaje de Descripcin de Datos. Manipulacin: Permite: Buscar, Aadir, Suprimir y Modificar los datos contenidos en la Base de Datos. La manipulacin misma supone: Definir un criterio de seleccin, Definir la estructura lgica a recuperar, Acceder a la estructura fsica. Esta manipulacin es realizada mediante un LMD o Lenguaje de Manipulacin de Datos. Utilizacin: La utilizacin permite acceder a la base de datos, no a nivel de datos sino a la base como tal, para lo cual: Rene las interfaces de los usuarios y suministra procedimientos para el administrador. 8.3Tareas El manejador es responsable de las siguientes tareas: 1 Interaccin con el manejador de archivos: Los datos en la base se guardan en disco mediante el sistema de archivos, proporcionado comnmente por el sistema operativo. El manejador de la base, traduce las diferentes proposiciones del manejo de datos en comandos del sistema de archivos de bajo nivel. De esta forma el manejador se puede encargar del almacenamiento, recuperacin y actualizacin de los datos en la base. 2 Implantacin de la integridad: Los valores de los datos que se almacenan en la base, deben satisfacer ciertas limitantes de consistencia, estas limitantes deben ser determinadas por el administrador, pero es el manejador el encargado de verificar que las actualizaciones que se hagan a la base cumplan con dichas normas. 3 Puesta en prctica de la seguridad: El manejador de la base es quien verifica que los accesos a la base sean realizados por las personas autorizadas. 4 Respaldo y recuperacin: Entre las labores que debe ejecutar el manejador est la de verificar de forma constante la integridad de la base, y lograr recuperacin de datos y/o mejoras en caso que se requieran. 5 Control de concurrencia: Se podra entender, esta, como la principal tarea del

20

mailxmail - Cursos para compartir lo que sabes


manejador de la base, o por lo menos la ms difcil. Cuando varios usuarios estn accesando la base al mismo tiempo, es posible que la consistencia de los datos no se conserve. El manejador debe encargarse de coordinar los accesos de los diferentes usuarios, de forma que los datos en la base no se daen. En trminos ideales, un DBMS debe contar con estas funciones, sin embargo, no todos las poseen, as existen algunos manejadores que no cumplen la funcin de respaldo o de seguridad, dejndola al usuario o administrador; sin embargo un DBMS que sea completo y que deba manejar una base de datos multiusuario grande, es conveniente que cuente con todas estas operaciones. 8.4 Lenguajes Para cumplir sus objetivos el DBMS cuenta con varios lenguajes: Lenguaje de descripcin o definicin de datos: Un esquema de base de datos se especifica por medio de una serie de definiciones que se expresan en un lenguaje de definicin de datos (DDL-Data Definition Language). El resultado de la compilacin es un conjunto de tablas que se almacenan en el diccionario de datos. Existe un esquema DDL para las definiciones del nivel conceptual y un subesquema DDL para las definiciones del nivel externo. La estructura de almacenamiento y los mtodos de acceso empleados por el sistema se especifican por medio de un conjunto de definiciones de un tipo especial de DDL, llamado lenguaje de almacenamiento y definicin de datos; el resultado de la compilacin es una serie de instrucciones que especifican los detalles de implantacin de los esquemas de base de datos que normalmente no pueden ver los usuarios. Este lenguaje se define como un lenguaje de control dispositivo/medio. Existe adems un DBCS que es el sistema de control de la base de datos y permite el acceso a la definicin de datos. Lenguaje de manejo de datos: El DML (Data Managment Lenguage) es el que permite a los usuarios manejar o tener acceso a la base de datos. Permite recuperar, insertar o eliminar la informacin contenida. Existen dos tipos: Sin procedimiento: donde se indican que datos se necesitan pero no como.

Con procedimiento: donde se indican que datos se necesitan y la forma como se necesitan. Adems debe tener la capacidad de entender los mensajes con que contesta el DBMS La parte del DML que permite recuperar la informacin se llama lenguaje de consulta (que no es el mismo manejador de datos), este lenguaje no es algortmico, con este las consultas se pueden hacer desde una terminal en forma interactiva o inmerso dentro de un lenguaje de alto nivel. Los lenguajes de 4a. Generacin permiten la generacin de reportes, visualizacin de grficos o procesos de la base de datos de forma fcil y rpida. Lenguajes de Programacin: Estos son programas que pueden ser empleados por los programadores, algunos lenguajes de tercera generacin tiene la capacidad de entrar a interactuar con bases de datos. 8.5 CLASIFICACION DE LOS DBMS La forma o vista externa con que se presentan los datos al usuario en la mayora de

21

mailxmail - Cursos para compartir lo que sabes


La forma o vista externa con que se presentan los datos al usuario en la mayora de los sistemas actuales es idntica o muy semejante a la vista conceptual. La estructura lgica, en el mbito conceptual o externo, es la base para la clasificacin de los DBMS en las cuatro categoras siguientes: jerrquica, red, relacional y orientada a objetos. Cualquier categora debe permitir un acceso aleatorio a los datos requeridos, utilizando para tal fin una estructura de datos: redes, rboles, tablas o listas enlazadas. Cada DBMS est diseado para manejar un tipo de estructura lgica. No se pueden procesar programas diseados para otro DBMS. 8.5.1. Enfoque jerrquico La base de datos jerrquica consta de muchos registros. Cada nodo representa un tipo de registro conceptual o un segmento. Cada registro o segmento est constituido por un cierto nmero de campos que lo describen. Cada rama representa una relacin uno a muchos. Un cliente del banco puede tener muchos movimientos en su cuenta. En este caso 'muchos' significa cero, uno o ms de uno. 8.5.2 Enfoque de red Para representar este tipo de relacin, es necesario que los dos tipos de registro estn interconectados por medio de un registro conector llamado conjunto conector. 8.5.3. Enfoque relacional Un DBMS de enfoque relacional utiliza tablas bidimensionales llamadas relaciones para la representacin lgica de los datos y las relaciones entre ellos. Si las consultas sobre claves mltiples en el enfoque jerrquico se conseguan mediante relaciones padre-hijo, en el enfoque en red mediante conjuntos, para el enfoque relacional, la relacin uno a muchos entre el registro padre de un archivo y los registros hijos de otro archivo de la base de datos relacional se consigue mediante la utilizacin de campos de conexin, es decir, insertando el valor de la clave principal del registro padre en cada una de los registros hijos, consiguiendo relaciones parecidas al enfoque en red. Hay caractersticas propias del enfoque relacional que no se presentan en los otros dos enfoques: La facilidad para su representacin lgica, al realizarse mediante tablas separadas y no presentarse ningn tipo de jerarqua. La posibilidad de recuperar una tabla o un grupo de registros mediante una proposicin del DML, sin necesidad de acceder a otras relaciones. Su modo de operacin no esta orientado a registros sino sobre la tabla como conjunto. Se puede acceder a datos de cualquier columna de la tabla o filas de una o ms relaciones. Requisitos que han de cumplir las tablas en las bases de datos relacionales:

22

mailxmail - Cursos para compartir lo que sabes


La tabla puede tener solo un tipo de registro Cada registro posee un numero determinado de campos, cada uno de ellos con su nombre correspondiente. La base de datos tendr muchas tablas. Dentro de cada tabla, cada campo es distinto Cada registro de una tabla es nico; no hay registros duplicados. Los registros dentro de cada tabla no tienen una secuencia determinada.

Se pueden crear nuevas tablas relacionando campos procedentes de dos o ms tablas existentes. 3.4.4Enfoque orientado a objetos En los ltimos aos la tecnologa de diseo de las bases de datos se ha aplicado a terrenos ajenos al campo del procesamiento de datos, que en general carecen de al menos una de las caractersticas siguientes: Uniformidad Orientacin a registros Elementos de datos de pequeo tamao Campos atmicos

Las nuevas aplicaciones incluyen estas nuevas caractersticas: Diseo asistido por computadora (CAD, Computer - Aided Desing)

Ingeniera de software asistida por computadora (CASE, Computer- Aided Software Engineering). Bases de datos multimedia. Sistemas de informacin para oficinas (SIO). Bases de datos de hipertexto.

Estas nuevas aplicaciones de las bases de datos no se consideraban en los aos setenta, cuando se disearon inicialmente la mayor parte de los sistemas comerciales de base de datos. Ahora son posibles debido al incremento de memoria principal y de tamao de los discos, al aumento de la velocidad de las unidades centrales de procesamiento, al menor costo del hardware y a la mejor comprensin de la gestin de las bases de datos obtenidos en los ltimos aos. El modelo relacional y los modelos relacionales entre entidades no resultan suficientes para modelar las necesidades de datos de estas aplicaciones nuevas. Adems, hasta las necesidades de modelado de las aplicaciones comerciales tradicionales se han hecho ms complejas con el paso del tiempo, y resulta difcil expresar algunas de estas necesidades en el modelo relacional, como por ejemplo, imgenes y base de datos de hipertexto. 8.6 EL DICCIONARIO DE DATOS 8.6.1 Definicin Es una metabase, o una base de datos que contiene datos sobre los datos. Es una

23

mailxmail - Cursos para compartir lo que sabes


Es una metabase, o una base de datos que contiene datos sobre los datos. Es una base de datos del sistema y puede ser accesada de igual forma como se accesa cualquier tabla en la base de datos. 8.6.2 Contenido

Contiene todo sobre: Descripcin externa, conceptual e interna de la base de datos.

Descripcin de los campos, registros y referencias cruzadas entre registros de diferentes archivos. 8.6.3 Cdigos de autorizacin y seguridad de los datos, definicin de apodos. Esquemas externos de los programas, los usuarios y sus autorizaciones. Uso de diccionario

Adems de los usuarios, el DBA tambin accesa el diccionario para: Relacin del personal o usuarios que tienen acceso a los datos Fuente para las analistas, programadores de nuevas aplicaciones.

24

mailxmail - Cursos para compartir lo que sabes

9. Procesamiento de consultas estructuradas


El mal llamado Lenguaje Estructurado de Consulta (SQL de Structure Query Language), definido como un estndar para manejo de bases de datos, ni constituye un lenguaje como tal y tampoco es estructurado como si lo son los Lenguajes de tercera generacin declarativos, procedurales, procedimentales o imperativos, que sentaron las bases de la Programacin Estructurada, que Edward Yourdon proclam a partir del Lenguaje Pascal y el poderoso C, por lo que al sano juicio del autor de estas notas se propone como un Procesador de Consultas Estructuradas (Structure Query Processor), dado que son estas consultas son las que realmente tienen una estructura sencilla basada en las premisas, SELECT (Seleccione...), FROM (de...) desde un conjunto de archivos, WHERE (Dnde...) y precisamente donde ese "Dnde" se refiere a la ocurrencia de una predeterminada condicin si fuese necesaria. Desde luego es respetable la posicin de la ANSI de los Estados Unidos y la ISO, organismos internacionales para la normalizacin, quienes fueron los encargados de publicar este lenguaje como un estndar para el manejo de Bases de Datos como ORACLE, SYBASES y SQL SERVER entre otros. Hecha la aclaracin el SQL organiza sus sentencias en tres grupos principales que a su vez los define tambin como "lenguajes": El Lenguaje de Definicin de Datos (DDL, Data Definicin Language) el Lenguaje de Manipulacin de Datos (DML, Data Management Language) y el Lenguaje de Control de Datos (DCL, Data Control Language) 9.1.- Lenguaje de Definicin de datos Est conformado por un grupo de sentencias que soportan la definicin y declaracin de los objetos de la base de datos. Estos objetos pueden ser las Tablas, las Vistas, los Procedimientos, los ndices, los Disparadores, los Valores por Defecto, las Reglas, los Dominios e incluso la Base de Datos misma. Este grupo est conformado especficamente por las sentencias: CRAETE, ALTER y DROP. 9.2- Lenguaje de Manipulacin de Datos Est conformado como se indica por las sentencias que sirven para manipular los datos que se han de almacenar como registros en las tablas, por tanto modifican, insertan, muestran o eliminan registros a las mismas, y fundamentalmente son: MODIFY, INSERT, UPDATE, DELETE y SELECT. 9.3- Lenguaje de control de Datos Est conformado por sentencias que controlan la integridad, atomicidad y en general la seguridad de los datos y en este grupo podemos citar: COMMIT TRANSACTION, ROLLBACK TRANSACTION, GRANT y REVOKE.

25

mailxmail - Cursos para compartir lo que sabes

10. Creacin de la base de datos


Una base de datos puede estar compuesta por un conjunto amplio de objetos entre los cuales los principales son las tablas, creados todos con el comando o sentencia CREATE. No es necesario crear la base de datos para poder crear las tablas, pero si se quiere hacer un trabajo integral primero debiera crearse la Base de Datos utilizando la sentencia CREATE DATABASE nombrebd, donde nombrebd es un identificador que debe crear el usuario. El algoritmo para la implementacin de una base de datos es el siguiente: 1.- Definir en el disco duro a travs del tamanao en MegaBytes, el rea fsica , que contendr las tablas de la base de datos 2.- Crear las diferentes tablas de la base de datos. 3.- Insertar las filas de las diferentes tablas, sin violar la integridad referencial de los datos. 4.- Actualizar los datos que cambien con el tiempo en las diferentes tablas 5.- Eliminar las filas que ya no se requieran en las diferentes tablas. 6.- Realizar las consultas deseadas a las tblas de la base de datos a travs de la principal sentencia del SQL. y 7.- finalmente si se quiere, dar nombre a las consultas a travs de la creacin de vistas lgicas. Es de anotar que antes de crear la base de datos es necesario tratar de determinar que no existe una base de datos con el mismo nombre, en cuyo caso debemos borrarla para poder crear la nuestra con ese nombre ya que el sistema no nos permitir tener dos bases de datos con el mismo nombre, por lo cual digitaramos las siguientes instrucciones: IF DB_ID (`nombrebd) IS NOT NULL BEGIN DROP DATABASE nombrebd END A continuacin la sintaxis de la sentencia de creacin es: CREATE DATABASE nombrebd ON PRIMARY ( Name = nombrebd, Filename = `c:\nombrebd.mdf, Size = 5 mb, Maxsize = 11 mb, Filegrowth = 2 mb ) Log on ( Name = nombrebd_log, Filename = `c:\nombrebd. l d f , Size = 5 mb, /* path o direccin donde se crea*/ /* Tamao inicial de la base de datos*/ /* Tamao mximo de la base de datos*/ /* Crecimiento de la base de datos*/

26

mailxmail - Cursos para compartir lo que sabes


Masase = 11 mb, Filegrowth = 2 mb ) Lo anterior permitira crear la Base de Datos "nombrebd" como archivo principal con extensin .mdf y un tamao inicial de 5 MB en disco duro, con crecimientos de 2 MB hasta alcanzar un tamao mximo de 11MB, creando a su vez un archivo de registro de transacciones con extensin .ldf A partir de este punto se pueden crear los dems objetos de la base de datos, casi todos con la sentencia CREATE. Dentro del lenguaje de definicin (DL) del SQL, la sentencia CREATE permiten la definicin o creacin de muchos objetos de la base de datos tales como: tablas (esquemas), ndices, vistas, dominios, ligaduras de integridad y procedimientos. En esta oportunidad veremos las sentencias correspondientes a la creacin de los esquemas o lo que es lo mismo las tablas que contendrn los datos de la base de datos, la sentencia CREATE TABLE. La sentencia CREATE TABLE, define el nombre de la tabla, las columnas con su tipo de datos, las ligaduras de integridad que vigilan el valor que se guarde como dato en las columnas o atributos sean llaves o no Sntesis.: CREATE TABLE nombre _ tabla ( Campo1 tipo dato [NULL/NOT NULL] | CHECK (expresinLgica) | [DEFAULT expresinConstante], campo2 tipo dato [NULL/NOT NULL] | CHECK (expresinLgica) | DEFAULT expresinConstante], campo-N, PRIMARY KEY(campo_llave), FOREIGN KEY (campo_llave) REFERENCES tabla2(campo-llave_ tabla2))

27

Вам также может понравиться