Академический Документы
Профессиональный Документы
Культура Документы
OBJETIVO
El lxico de un lenguaje natural est constituido por todas las palabras y smbolos que lo
componen. Para un lenguaje de programacin la definicin tambin es vlida.
El ANALIZADOR LEXICO
Un programa fuente es una serie de smbolos (letras, smbolos, caracteres especiales: +,*, !). Con
estos smbolos se representan las construcciones del lenguaje tales como variables, etiquetas,
palabras reservadas, constantes, etc. Es necesario que el compilador o traductor identifique los
distintos significados de estas construcciones, que los creadores de lenguajes dan en la definicin
del lenguaje.
El programa fuente se trata inicialmente con el analizador lxico (en ingls scanner), con el
propsito de agrupar el texto en grupos de caracteres con significado propio llamados tokens o
componentes lxicos, tales como variables, identificadores, palabras reservadas y operadores. Por
razones de eficiencia a cada token se le asocia un atributo (o ms de uno) que se representa
internamente por un cdigo numrico o por un tipo enumerado.
Token
Es el nombre que se le da a cada patrn definido, ste nombre debe usarse en todos los
procesos del anlisis en todos los lexemas encontrados.
Patrn
Es una representacin lgica de una serie de agrupaciones de caracteres con caractersticas
comunes.
Lexema
Es cada una de las combinaciones de caracteres que encajan en la definicin de un patrn o
token. Ej. Variable1, x, a, edad, y2, etc.
Atributo
Caractersticas propias de cada token, por tanto se les denomina atributos del token.
Gramtica
Se define como un ente formal para especificar de una manera finita el conjunto de cadenas de
smbolos que constituyen un lenguaje.
Alfabeto
Conjunto finito de smbolos no vaco que conforman una gramtica, se representan por
(sigma).
Smbolo
Entidad abstracta que no se va a definir pues se deja como axioma. Normalmente son letras de
alfabetos, nmeros o caracteres especiales como +, -, *, /, etc. No necesariamente sern uno
solo, ya que un smbolo puede ser una combinacin como palabras reservadas de un lenguaje
de programacin then, end, beging, else, while, etc.
Expresin Regular
Representan patrones de cadenas de caracteres. Se conocen ms como metalenguajes que
sirven para describir los lenguajes regulares.
Diagrama de Transicin
Es el conjunto de secuencias de entrada que representan grficamente los smbolos validos por
la gramtica, es una representacin de los universales autmatas que aparecen en la
matemtica y otras ciencias.
Tabla de Transiciones
Es la manera ms cercana de representar los autmatas, consta de filas que representan los
estados y las columnas que representan los smbolos de entrada. Adicionalmente se agregan
dos columnas para representar los tokens y para indicar retrocesos.
Cadena
Se define como una secuencia de smbolos de un lenguaje determinado. Por ejemplo 0001,
abcd, a+4*b, 11000, etc. Una cadena siempre tiene una longitud que esta denotada por la
cantidad de smbolos independientes que la conforman.
|abcde| 5
|000111| 6
Cuando la cadena es vaca se representa como ||0.
Lenguaje
Un lenguaje es un conjunto de palabras que se puede representar con un determinado alfabeto.
Autmata
Es una construccin lgica que recibe como entrada una cadena de smbolos y produce una
salida indicando si la salida es una cadena que pertenece a un determinado lenguaje.
Autmata Finito
Son formas matemticas para describir las diferentes clases particulares de algoritmos.En el
mundo de la computacin permiten reconocer cadenas de smbolos, por eso se usan en la
etapa de lxico de los compiladores.
Si se permite que desde un estado se realicen cero, una o ms transiciones mediante el mismo
smbolo de entrada, se dice que el autmata finito es no determinista. A veces es ms
conveniente disear autmatas finitos no determinista.
Un autmata finito no determinista es una coleccin de cinco objetos (Q,S, Q0, Qf, f), donde:
Autmata de Pila
Autmata de Turing
Facebook.com/pavillalta
twitter.com/pavillalta
Correos de contacto
pavillalta@gmail.com
pavillalta@ugb.edu.sv
Blogs educativos