Академический Документы
Профессиональный Документы
Культура Документы
INDICE INTRODUCCIN REPRESENTACION INTERNA DE DATOS NUMERICOS REPRESENTACION INTERNA DE NUMEROS ENTEROS -MODULO Y SIGNO -COMPLEMENTO A 1 -COMPLEMENTO A 2 REPRESENTACION EN COMA FIJA -CODIFICACION BCD -DESEMPAQUETADOS -EMPAQUETADOS REPRESENTACION INTERNA DE NUMEROS REALES REPRESENTACION EN COMA FLOTANTE -NOTACION EXPONENCIAL -NORMALIZACION IEEE 754 REPRESENTACION INTERNA DE LOS TEXTOS -CODIFICACION BCD -CODIFICACION EBCDIC -CODIFICACION ASCII -CODIFICACION UNICODE CONCLUCIONES REFERENCIAS BIBLIOGRAFICAS
INTRODUCCIN
En la actualidad, y desde hace ya muchos aos, el hombre en su vida diaria se comunica, almacena informacin y la maneja desde el punto de vista numrico con el sistema decimal y desde el punto de vista alfabtico con el idioma. Debido a su construccin
basada fundamentalmente en circuitos electrnicos digitales, lo hace desde ambos puntos de vista con el sistema binario. En este trabajo se estudian los aspectos relacionados con la interpretacin de la informacin en el interior de las computadoras. Se considera tanto la representacin de los datos numricos como los no numricos.
El negativo de un nmero positivo se obtiene complementando todos sus dgitos (cambiando 0 por 1 y viceversa), incluido el bit de signo. COMPLEMENTO A 2 (C-2) Este sistema de representacin utiliza el bit ms a la izquierda para el signo, correspondiendo el 0 para el signo + y el 1 para el -. En el caso de los nmeros positivos, los n-1 bits de la derecha representan el mdulo (igual en en los dos casos o anteriores). El negativo de un nmero se obtienen en dos pasos: Se complementa el nmero positivo en todos sus bits (cambiando los ceros por 1 y viceversa), incluido el bit de signo, es decir se realiza el complemento a 1. Al resultado obtenido anteriormente se le suma 1 (en binario) despreciando el ltimo acarreo si existe. REPRESENTACION EN COMA O PUNTO FIJO Su nombre viene de la posicin en que se supone situado el punto decimal, que ser fija. El punto fijo es utilizado para los nmeros enteros, suponiendo el punto decimal implcitamente a la derecha de los bits. Existen tres formas de representar nmeros en coma fija: DECIMAL CODIFICADO EN BINARIO (BCD) En el sistema BCD cada cifra de un nmero decimal se representa por un conjunto de 4 bits, siendo la tabla de equivalencias entre ambos la siguiente:
DECIMAL 0 1 2 3 4 5 6 7 8 9
BCD 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001
DECIMAL DESEMPAQUETADO Un nmero decimal se representa de forma que cada una de sus cifras ocupa un octeto o byte. Cada uno de los octetos lleva en su cuarteto de la izquierda cuatro unos (1111) denominados bits de zona y en el cuarteto de la derecha, la codificacin de la cifra en BCD, denominndose bits de dgito. El cuarteto de la izquierda de la ltima cifra (cifra de la derecha) representa el signo del nmero, siendo 1100 para el signo positivo (+) y 1101 para el signo negativo (-).
DECIMAL EMPAQUETADO En este sistema de codificacin se representa cada cifra decimal de un cuarteto (se eliminan los bits de zona), salvo el primer octeto de la derecha en el que su cuarteto tambin de la derecha lleva el signo con las mismas consideraciones que en el caso anterior).
N = mantisa X base de exponenciacin MANTISA Es un nmero real con punto decimal implcito a la izquierda de sus bits, siendo representada generalmente en mdulo y signo o complemento a 1 o complemento a 2. BASE DE EXPONENCIACION Es una potencia de 2 determinada por el fabricante del ordenador.
EXPONENTE
N-1
Hasta la dcada de los aos ochenta puede decirse que cada fabricante de computadores utilizaba su sistema propio para la representacin de nmeros reales; pero es de gran importancia que existan sistemas normalizados, ya que ello posibilita que los matemticos construyan bibliotecas de programas de alta calidad, los diseadores de computadores puedan construir unidades aritmtico-lgicas muy eficientes, y los fabricantes de circuitos integrados puedan construir aceleradores y coprocesadores aritmticos estndar. Debido a ello, de 1977 a 1985, la asociacin IEEE desarrollo un sistema normalizado de representacin, denominado Normalizacin IEEE 754 que es el que hoy da tiene mayor aceptacin. Es un formato estndar para los nmeros flotantes de 32 y 64 bits. REPRESENTACION INTERNA DE LOS TEXTOS La informacin en formato de texto se representa mediante un cdigo en el que cada uno de los distintos smbolos del texto (tales como letras del alfabeto o signos de puntuacin) se asignan a un nico patrn de bits. El texto se representa como una cadena larga de bits en la cual los sucesivos patrones representan los sucesivos smbolos del texto original, se puede representar cualquier informacin escrita (texto) mediante caracteres. La representacin de la informacin de tipo texto escrito se hace codificando, en un octeto, cada uno de los caracteres que componen dicha informacin. Ejemplos: 1) Cdigo Baudot: Data de finales del S. XIX. Lo desarroll Jean-Maurice-mile Baudot. Utilizaba 5 bits por carcter y se usaba en telegrafa. 2) Alfabeto Internacional N 2: 1901. Donald Murray aadi nuevos caracteres y cdigos de desplazamiento al anterior. Cada carcter 5 bits. Existen algunos caracteres de control. Inicialmente se utiliz en los teletipos. (Teleimpresores o TTY). 3) Codificacin FIELDATA: Proyecto de Estados Unidos a finales de los 50. Pretenda crear un estndar para recoger y distribucin en el campo de batalla. Utiliza bloques de 6 dgitos para representar los caracteres. Slo se pueden representar 26 datos, es decir 64 caracteres. Al introducir un texto en una computadora, a travs de un perifrico, los caracteres se codifican segn un cdigo de entrada/salida de modo que a cada carcter se le asocia una determinada combinacin de n bits. Los cdigos ms utilizados en la actualidad son: Cdigo BCD (Extended Binary Coded Decimal Interchange Code) Utiliza n=6 bits se pueden representar m=26=64 caracteres. A veces se aade a su izquierda un bit adicional para verificar posibles errores en la transmisin o grabacin del cdigo (bit de paridad, criterio impar). Cdigo EBCDIC (Extended Binary Coded Decimal Interchange Code).
Este cdigo utiliza n = 8 bits de forma que se puede codificar hasta m = 28 = 256 smbolos diferentes. ste fue el primer cdigo utilizado para computadoras, aceptado en principio por IBM. Cdigo ASCII (American Standard Code for Information Interchange). El cdigo ASCII bsico utiliza 7 bits y permite representar 128 caracteres (letras maysculas y minsculas del alfabeto ingls, smbolos de puntuacin, dgitos 0 a 9 y ciertos controles de informacin tales como retorno de carro, salto de lnea, tabulaciones, etc.). Este cdigo es el ms utilizado en computadoras, aunque el ASCII ampliado con 8 bits permite llegar a 28 (256) caracteres distintos, entre ellos ya smbolos y caracteres especiales de otros idiomas como el espaol. Cdigo Unicode Aunque ASCII ha sido y es dominante en los caracteres se leen como referencia, hoy da se requiere de la necesidad de representacin de la informacin en muchas otras lenguas, como el portugus, espaol, chino, el japons, el rabe, etc. Este cdigo utiliza un patrn nico de 16 bits para representar cada smbolo, que permite 216 bits o sea hasta 65.536 patrones de bits (smbolos) diferentes. Es un estndar internacional establecido por el Consorcio Unicote (formado por empresas como Apple Computer, Microsoft, IBM, HP, ). Su objetivo es representar cualquier carcter jams escrito. Windows NT y sus sucesores lo usan. Tambin sistemas operativos como Linux, Mac OS X y lenguajes de programacin como Java, Perl y C#. CONCLUSIONES El conclusin puedo resumir que el almacenamiento de informacin como caracteres codificados es ineficiente cuando la informacin se registra como numrica pura ,la solucin es que para la representacin de datos numricos al introducir un numero en la computadora se codifica y se almacena como un texto o cadena de caracteres, a cada dato se le enva un tipo de dato especfico dentro del programa, lo que se tiene que hacer es asociar cada dato al tipo adecuado correspondiente a las tareas y operaciones que se vayan a realizar con dicho dato. La representacin de la informacin de tipo texto escrito se hace codificando, en un octeto, cada uno de los caracteres que componen dicha informacin. REFERENCIAS BIBLIOGRAFICAS Introduccin a la Informtica (1a Edicin Febrero 1994) Cristbal Pareja, ngel Andero y Manuel Ojeda. Representacin de la Informacin en la Computadora (2000) Paco vila Fundamentos de Programacin (Universidad de Salamanca - 2002) Alvares S. Bravo