Вы находитесь на странице: 1из 6

REPRESENTACION INTERNA DE DATOS NUMERICOS Y DE TEXTOS EN LA COMPUTADORA

INDICE INTRODUCCIN REPRESENTACION INTERNA DE DATOS NUMERICOS REPRESENTACION INTERNA DE NUMEROS ENTEROS -MODULO Y SIGNO -COMPLEMENTO A 1 -COMPLEMENTO A 2 REPRESENTACION EN COMA FIJA -CODIFICACION BCD -DESEMPAQUETADOS -EMPAQUETADOS REPRESENTACION INTERNA DE NUMEROS REALES REPRESENTACION EN COMA FLOTANTE -NOTACION EXPONENCIAL -NORMALIZACION IEEE 754 REPRESENTACION INTERNA DE LOS TEXTOS -CODIFICACION BCD -CODIFICACION EBCDIC -CODIFICACION ASCII -CODIFICACION UNICODE CONCLUCIONES REFERENCIAS BIBLIOGRAFICAS

INTRODUCCIN
En la actualidad, y desde hace ya muchos aos, el hombre en su vida diaria se comunica, almacena informacin y la maneja desde el punto de vista numrico con el sistema decimal y desde el punto de vista alfabtico con el idioma. Debido a su construccin

basada fundamentalmente en circuitos electrnicos digitales, lo hace desde ambos puntos de vista con el sistema binario. En este trabajo se estudian los aspectos relacionados con la interpretacin de la informacin en el interior de las computadoras. Se considera tanto la representacin de los datos numricos como los no numricos.

REPRESENTACION INTERNA DE DATOS NUMERICOS


Los computadores no almacenan los nmeros con precisin infinita sino de forma aproximada empleando un nmero fijo de bits o bytes (grupos de ocho bits). Prcticamente todos las computadoras permiten al programador elegir entre varias representaciones o 'tipos de datos'. Los diferentes tipos de datos pueden diferir en el nmero de bits empleados, pero tambin (lo que es ms importante) en cmo el nmero representado es almacenado: en formato fijo (tambin denominado 'entero') o en punto flotante (denominado 'real').

REPRESENTACION INTERNA DE LOS NUMEROS ENTEROS


Los datos de tipo entero se representan en el interior de la computadora en notacin binaria. La memoria ocupada por los tipos enteros depende del sistema, pero normalmente son dos, bytes (en las versiones de MS-DOS y versiones antiguas de Windows y cuatro bytes en los sistemas de 32 bits como Windows o Linux). Ejemplos: 1) Un entero almacenado en 2 bytes (16 bits): 1000 1110 0101 1011 2) Representacin decimal: N = 3459 = 3 . 103 + 4 . 102 + 5 . 101 + 9 . 100 3) Representacin binaria: N(2) = 10111 = 1 . 24 + 0 . 23 + 1 . 22 + 1 . 21 + 1 . 20 = 23(10) Los ordenadores utilizan varios mtodos para la representacin interna de los nmeros s (positivos y negativos), que son: MODULO Y SIGNO Consiste en reservar un bit para el signo. Con n bits disponibles, uno indica el signo y los n-1 restantes indican el modulo. Normalmente, el bit de la izquierda se reserva para el signo. El bit de signo a 0 indica que el n es positivo, mientras que si es 1, indica que el nmero es negativo. COMPLEMENTO A 1 (C-1) Este sistema de representacin utiliza el bit de ms a la izquierda para el signo, correspondiendo el 0 para el signo + y el 1 para el signo -. Para los nmeros positivos, los n-1 bits de la derecha representan el mdulo (igual que en el caso anterior).

El negativo de un nmero positivo se obtiene complementando todos sus dgitos (cambiando 0 por 1 y viceversa), incluido el bit de signo. COMPLEMENTO A 2 (C-2) Este sistema de representacin utiliza el bit ms a la izquierda para el signo, correspondiendo el 0 para el signo + y el 1 para el -. En el caso de los nmeros positivos, los n-1 bits de la derecha representan el mdulo (igual en en los dos casos o anteriores). El negativo de un nmero se obtienen en dos pasos: Se complementa el nmero positivo en todos sus bits (cambiando los ceros por 1 y viceversa), incluido el bit de signo, es decir se realiza el complemento a 1. Al resultado obtenido anteriormente se le suma 1 (en binario) despreciando el ltimo acarreo si existe. REPRESENTACION EN COMA O PUNTO FIJO Su nombre viene de la posicin en que se supone situado el punto decimal, que ser fija. El punto fijo es utilizado para los nmeros enteros, suponiendo el punto decimal implcitamente a la derecha de los bits. Existen tres formas de representar nmeros en coma fija: DECIMAL CODIFICADO EN BINARIO (BCD) En el sistema BCD cada cifra de un nmero decimal se representa por un conjunto de 4 bits, siendo la tabla de equivalencias entre ambos la siguiente:

DECIMAL 0 1 2 3 4 5 6 7 8 9

BCD 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001

DECIMAL DESEMPAQUETADO Un nmero decimal se representa de forma que cada una de sus cifras ocupa un octeto o byte. Cada uno de los octetos lleva en su cuarteto de la izquierda cuatro unos (1111) denominados bits de zona y en el cuarteto de la derecha, la codificacin de la cifra en BCD, denominndose bits de dgito. El cuarteto de la izquierda de la ltima cifra (cifra de la derecha) representa el signo del nmero, siendo 1100 para el signo positivo (+) y 1101 para el signo negativo (-).

DECIMAL EMPAQUETADO En este sistema de codificacin se representa cada cifra decimal de un cuarteto (se eliminan los bits de zona), salvo el primer octeto de la derecha en el que su cuarteto tambin de la derecha lleva el signo con las mismas consideraciones que en el caso anterior).

REPRESENTACION INTERNA DE LOS NUMEROS REALES


Los nmeros reales son aquellos que contienen una parte decimal como 2,6 y 3,14152. Los reales se representan en notacin cientfica o en coma flotante; por esta razn en los lenguajes de programacin, como C++, se conocen como nmeros en coma flotante. Ejemplos: 1) El nmero 50467894.1235 podra expresarse como: 50467894.1235 = 504678941235 x 104 = 5.04678941235; 107 = 0.504678941235; 108 =. La base B = 10, M = 504678941235 representa la mantisa y exp = 8 el exponente. 2) El numero 1001.1100 110 x 2-5 normalizado seria: 1.0011 1001 10 x 2-2 3) El numero 0.0000 1101 101 x 234 normalizado seria: 1.1011 01 x 228 REPRESENTACION EN COMA FLOTANTE Existen dos formas de representar los nmeros reales. La primera se utiliza con la notacin del punto decimal (ojo en el formato de representacin espaol de nmeros decimales, la parte decimal se representa por coma). La segunda forma para representar nmeros en coma flotante en la notacin cientfica o exponencial, conocida tambin como notacin E. Esta notacin es muy til para representar nmeros muy grandes o muy pequeos. NOTACION EXPONENCIAL Para representar los nmeros en coma flotante se utiliza la notacin cientfica o exponencial matemtica en la que una cantidad se representa de la forma:
exponente

N = mantisa X base de exponenciacin MANTISA Es un nmero real con punto decimal implcito a la izquierda de sus bits, siendo representada generalmente en mdulo y signo o complemento a 1 o complemento a 2. BASE DE EXPONENCIACION Es una potencia de 2 determinada por el fabricante del ordenador.

EXPONENTE
N-1

Se representa en mdulo y signo o en exceso a 2 NORMALIZACION IEEE 754

siendo siempre un nmero entero.

Hasta la dcada de los aos ochenta puede decirse que cada fabricante de computadores utilizaba su sistema propio para la representacin de nmeros reales; pero es de gran importancia que existan sistemas normalizados, ya que ello posibilita que los matemticos construyan bibliotecas de programas de alta calidad, los diseadores de computadores puedan construir unidades aritmtico-lgicas muy eficientes, y los fabricantes de circuitos integrados puedan construir aceleradores y coprocesadores aritmticos estndar. Debido a ello, de 1977 a 1985, la asociacin IEEE desarrollo un sistema normalizado de representacin, denominado Normalizacin IEEE 754 que es el que hoy da tiene mayor aceptacin. Es un formato estndar para los nmeros flotantes de 32 y 64 bits. REPRESENTACION INTERNA DE LOS TEXTOS La informacin en formato de texto se representa mediante un cdigo en el que cada uno de los distintos smbolos del texto (tales como letras del alfabeto o signos de puntuacin) se asignan a un nico patrn de bits. El texto se representa como una cadena larga de bits en la cual los sucesivos patrones representan los sucesivos smbolos del texto original, se puede representar cualquier informacin escrita (texto) mediante caracteres. La representacin de la informacin de tipo texto escrito se hace codificando, en un octeto, cada uno de los caracteres que componen dicha informacin. Ejemplos: 1) Cdigo Baudot: Data de finales del S. XIX. Lo desarroll Jean-Maurice-mile Baudot. Utilizaba 5 bits por carcter y se usaba en telegrafa. 2) Alfabeto Internacional N 2: 1901. Donald Murray aadi nuevos caracteres y cdigos de desplazamiento al anterior. Cada carcter 5 bits. Existen algunos caracteres de control. Inicialmente se utiliz en los teletipos. (Teleimpresores o TTY). 3) Codificacin FIELDATA: Proyecto de Estados Unidos a finales de los 50. Pretenda crear un estndar para recoger y distribucin en el campo de batalla. Utiliza bloques de 6 dgitos para representar los caracteres. Slo se pueden representar 26 datos, es decir 64 caracteres. Al introducir un texto en una computadora, a travs de un perifrico, los caracteres se codifican segn un cdigo de entrada/salida de modo que a cada carcter se le asocia una determinada combinacin de n bits. Los cdigos ms utilizados en la actualidad son: Cdigo BCD (Extended Binary Coded Decimal Interchange Code) Utiliza n=6 bits se pueden representar m=26=64 caracteres. A veces se aade a su izquierda un bit adicional para verificar posibles errores en la transmisin o grabacin del cdigo (bit de paridad, criterio impar). Cdigo EBCDIC (Extended Binary Coded Decimal Interchange Code).

Este cdigo utiliza n = 8 bits de forma que se puede codificar hasta m = 28 = 256 smbolos diferentes. ste fue el primer cdigo utilizado para computadoras, aceptado en principio por IBM. Cdigo ASCII (American Standard Code for Information Interchange). El cdigo ASCII bsico utiliza 7 bits y permite representar 128 caracteres (letras maysculas y minsculas del alfabeto ingls, smbolos de puntuacin, dgitos 0 a 9 y ciertos controles de informacin tales como retorno de carro, salto de lnea, tabulaciones, etc.). Este cdigo es el ms utilizado en computadoras, aunque el ASCII ampliado con 8 bits permite llegar a 28 (256) caracteres distintos, entre ellos ya smbolos y caracteres especiales de otros idiomas como el espaol. Cdigo Unicode Aunque ASCII ha sido y es dominante en los caracteres se leen como referencia, hoy da se requiere de la necesidad de representacin de la informacin en muchas otras lenguas, como el portugus, espaol, chino, el japons, el rabe, etc. Este cdigo utiliza un patrn nico de 16 bits para representar cada smbolo, que permite 216 bits o sea hasta 65.536 patrones de bits (smbolos) diferentes. Es un estndar internacional establecido por el Consorcio Unicote (formado por empresas como Apple Computer, Microsoft, IBM, HP, ). Su objetivo es representar cualquier carcter jams escrito. Windows NT y sus sucesores lo usan. Tambin sistemas operativos como Linux, Mac OS X y lenguajes de programacin como Java, Perl y C#. CONCLUSIONES El conclusin puedo resumir que el almacenamiento de informacin como caracteres codificados es ineficiente cuando la informacin se registra como numrica pura ,la solucin es que para la representacin de datos numricos al introducir un numero en la computadora se codifica y se almacena como un texto o cadena de caracteres, a cada dato se le enva un tipo de dato especfico dentro del programa, lo que se tiene que hacer es asociar cada dato al tipo adecuado correspondiente a las tareas y operaciones que se vayan a realizar con dicho dato. La representacin de la informacin de tipo texto escrito se hace codificando, en un octeto, cada uno de los caracteres que componen dicha informacin. REFERENCIAS BIBLIOGRAFICAS Introduccin a la Informtica (1a Edicin Febrero 1994) Cristbal Pareja, ngel Andero y Manuel Ojeda. Representacin de la Informacin en la Computadora (2000) Paco vila Fundamentos de Programacin (Universidad de Salamanca - 2002) Alvares S. Bravo

Вам также может понравиться