Вы находитесь на странице: 1из 4

DEFINICIN DE UNA GRAMTICA El paradigma formal ms famoso y rpidamente desarrollado para la Caracterizacin de lenguajes, es el derivado del concepto de gramtica

generativa de

Noam Chomsky. En Chomsky [56], este celebrrimo lingista norteamericano que


Intent formalizar los lenguajes naturales, partiendo de que un lenguaje L es un Subconjunto de todas las secuencias (finitas o no), que podemos formar mediante la Concatenacin de los elementos de un alfabeto , define la gramtica mediante la Cuaterna siguiente: : vocabulario finito de smbolos Terminales. stos son los smbolos que Realmente aparecen en una frase. Nunca aparecern en el lado izquierdo de Una produccin (lo cual definiremos ms adelante dentro de esta cuaterna). Los smbolos terminales deben ser smbolos vlidos del lenguaje. N: conjunto finito de smbolos No Terminales, los cuales son meta smbolos Que deben ser definidos por otras producciones (o reglas gramaticales), es Decir, que tambin aparecen en el lado izquierdo de las mismas. Los Smbolos No Terminales se pueden definir como variables sintcticas. S: un smbolo No Terminal bsico (axiomtico, segn la definicin de Chomsky). Ser el smbolo principal o axioma que describir oraciones Enteras (y no sub cadenas, como describen los smbolos No Terminales) de Un lenguaje natural. P: conjunto, tambin finito, de reglas que nos dicen cmo se pueden generar Las oraciones, cmo partiendo del axioma, podemos llegar a la oracin Terminal. Este conjunto ser un simple subconjunto de: P (N ) * N(N ) * (N ) * Lo cual, expresado en una notacin ms clsica en lingstica sera: A = Donde: AN , , (N ) * Siendo posible que tanto como sean iguales a la cadena nula. El lenguaje L as definido, se obtendra aplicando el siguiente procedimiento no Algortmico (no garantiza tiempo finito para una gramtica genrica): S es una forma oracional. Si es una forma oracional, y = pertenece a P, tambin ser Forma oracional. Una forma oracional compuesta nicamente por smbolos Terminales, Constituir una oracin del lenguaje. Como ejemplo, veamos que el enunciado en castellano: El hombre compr el Libro, puede derivarse, basndonos en una pequea gramtica, mediante la siguiente Secuencia de producciones: S Sintagma Nominal Sintagma Verbal

Artculo Nombre Sintagma Verbal El Nombre Sintagma Verbal El hombre Sintagma Verbal El hombre Verbo Sintagma Nominal El hombre compr Sintagma Nominal El hombre compr Artculo Nombre El hombre compr el Nombre El hombre compr el libro Entonces, si abreviamos la frase "El hombre compr el libro" Ehcel, tenemos Que: Ehcel* puede producir todas las combinaciones. Adems, Ehcel ser aceptado por El lenguaje definido por el conjunto de producciones anterior, Ehcel L, ya que Ehcel *. Ahora, podemos definir entonces un lenguaje L como el conjunto de todas las Cadenas de smbolos Terminales que pueden derivarse del smbolo inicial o axioma S: L = { | S es una secuencia de y * } Siendo una cadena de smbolos Terminales. 2.4.1 Representacin de gramticas Para la representacin de una gramtica utilizaremos la BNF. La BNF (Backus

Normal Form, Backus-Naur Form, en homenaje a Backus, su creador y a Naur, su


Continuador), es un metalenguaje muy utilizado para definir la estructura sintctica de Lenguajes de programacin (lenguajes formales). La forma de Backus-Naur fue creada Para definir la escritura sintctica del lenguaje de programacin ALGOL60. Las Notaciones BNF, reducen el nmero de reglas necesarias. Para ello, utilizan los Siguientes meta smbolos: La barra disyuntiva '|': unifica en una, dos reglas con el mismo smbolo No Terminal a la izquierda del igual. Las reglas A = aA y A = bB, se van a Convertir en la regla A = aA | bB. El parntesis de opcionalidad '(...)': dos reglas iguales, salvo una expresin Inserta, equivalen a la mayor de ellas con la expresin inserta entre parntesis. Las reglas A = aB y A = a se convierten en A = a(B). El signo ms de recursividad '+': adjunto a una expresin, equivale a las Reglas A = ...A y A = A... Por ejemplo: A = aA y A = a se transformar en A = a+. El asterisco '*': equivale a una expresin con ms y entre parntesis. As, A* Es lo mismo que (A+). Los corchetes '[]': para alterar la prioridad en la interpretacin de los Meta smbolos. Como '+' y '*' tienen ms prioridad que la barra '|', son Expresiones diferentes: A | B+ y [A | B]+. Traduciendo esta notacin infija a prefija, se gana en facilidad de procesamiento

Pero no en facilidad de escritura (hay que escribir ms).Captulo 2. Lenguajes naturales y lenguajes formales Pagina 19 2.5 JERARQUA DE CHOMSKY A fin de precisar ms qu tipo de gramtica es capaz de generar un lenguaje lo Ms parecido posible a los naturales, Chomsky clasific las gramticas y lenguajes Dentro de cuatro familias jerrquicamente ordenadas como modelos potenciales del Lenguaje natural. Esta clasificacin, conocida como jerarqua de Chomsky, se establece Aumentando las restricciones sobre la forma de las producciones. As pues, tenemos: Gramtica sin restricciones Tipo 0 Gramticas sensitivas al contexto Tipo 1 Gramticas libres de contexto Tipo 2 Gramticas regulares Tipo 3 Las restricciones colocadas en las reglas, aumenta con el nmero de la Gramtica. Las gramticas de tipo 0, son gramticas sin restricciones, es decir, no hay Restricciones ni para el lado izquierdo, ni para el lado derecho de las producciones. Su potencia es la de una mquina de Tu ring, y sus reglas son del tipo: = Cuadro 2.1. Gramtica de la notacin BNF. Notacin BNF Expresin Expresin Trmino | Expresin Expresin Trmino Trmino1 Parntesis Trmino1 Trmino * Trmino1 Trmino + Trmino1 Trmino Trmino Smbolo Trmino Corchete Corchete [Expresin] Parntesis (Expresin) No existe algoritmo que en tiempo finito nos diga si una cadena obedece o no las Reglas de una gramtica de reescritura tan generalizada. Cuando Chomsky formul sus objeciones a las gramticas de estructura de Sintagma (tipo 2), propuso la utilizacin de reglas de tipo 0 para el reordenamiento, Elisin, etc., de elementos. La no existencia de algoritmo de parsing, mostraba que su Potencia superaba en mucho a las lenguas naturales, y el formato de las reglas de Reescritura se limit mucho (los clsicos movimientos de sintagmas por te matizacin, Interrogacin...). Una gramtica sin restricciones, es una cuaterna de la forma (V, , P, S), donde V es un conjunto de variables o no terminales, (el alfabeto) es un conjunto finito de

Smbolos terminales, P es un conjunto finito de reglas, y S es un elemento de V llamado El smbolo inicial o axioma de la gramtica. Una produccin de una gramtica de este Tipo, tiene la forma que ya hemos visto anteriormente ( = ), donde + (V ) y Donde * (V ) . Los conjuntos V y son disjuntos.

Вам также может понравиться