Академический Документы
Профессиональный Документы
Культура Документы
Desarrollo de aplicaciones.
Existen varios tipos de Gramticas, las que mas se usan en computacin son las gramticas
generativas, definidas por Noam Chomsky.
Las Gramticas Generativas constan de la siguiente tupla de elementos:
G = (V, T, P, S)
Donde:
V: conjunto finito de Variables (smbolos no terminales/categoras sintcticas)
T: conjunto finito de smbolos Terminales (alfabeto terminal o alfabeto de smbolos)
P: conjunto finito de Producciones o Reglas (definicin recursiva del lenguaje)
Cada regla o produccin consta de:
Cabeza: variable.
a : smbolo de produccin.
Cuerpo: cadena de 0 o mas smbolos terminales y/o variables.
Es decir una regla tiene la forma: Cabeza a Cuerpo, por ejemplo: Por ejemplo:
A a aBA donde A,B en V, a en T
S: smbolo inicial
Nota: Se asume que de V I T=
Las gramticas generativas son modelos matemticos finitos que nos permiten generar las
cadenas o palabras de un lenguaje finito o infinito.
Segn la Jerarqua de Chomsky: las gramticas generativas se clasifican en 4 tipos. Esta
clasificacin es inclusiva, es decir tipo 3 tipo 2 tipo 1 tipo 0
Tipo
Gramtica
Restricciones a la forma
de las Reglas
Irrestricta
Ninguna restriccin
12 a 12 3
donde ii en (V U T)*
La
parte
derecha
Dependientes
del Contexto o contiene como mnimo
Sensibles
de los smbolos de la parte
izquierda
Contexto
AB a AB
Donde A,B en V y , en
(V U T)*
Independiente La parte izquierda solo
del Contexto
puede tener un smbolo
A a ,
Donde A en V, y en (V
U T)*
Regulares
La regla solo puede
tener 2 formas:
A a aB y A a a, donde
A,B en V y a en T
Lenguaje
Autmata
Enumerables
recursivamente
Mquina de
Turing
Dependiente
del Contexto
Autmata
lineales
infinitos
Independiente
del Contexto
Autmata
de Pilas
Regulares
Autmata
finito
q0
q1
f1
0
inicio
0
1
Para obtener la GR a partir del anterior AFD se debe hacer las siguientes equivalencias:
A 1B
A 0A
B 1B
B 0C
B0
C 1B
C 0A
S | 0 | 1 | 1S1 | 0S0
Derivacin
Aplicacin de las producciones de una Gramtica para obtener una cadena de
terminales. Consiste en sustituir la variable de la cabeza por el cuerpo de la produccin.
Smbolo empleado es: (un paso de derivacin)
A si existe la produccin A
A en V y , , en (V U T)*
mi
md
rboles de Derivacin
ES un rbol formado a partir de la derivacin de una gramtica. Sirve para
ambigedad (ms de un rbol de derivacin y por tanto de interpretaciones)
estudiar
la
Caractersticas:
- Cada nodo interior es variable.
- Cada nodo hoja es Terminal o
- Si existe una produccin A a X1X2 . Xk, ver rbol de derivacin siguiente:
A
X1
X2 Xk
Prof. Hilda Contreras Teora de la Computacin (Pregrado)
S
1
1
0
Ejercicios
n
n
1. L = {0 1 , n 1}
S 01 | 0S1
n
n
2. L = {0 1 , n 0}
S | 01 | 0S1
n
m
3. L = {0 1 , n m}
S 0 | 0S | 0S1
Gramticas ambiguas
La ambigedad se refiere a la estructura de la gramtica
Si cada cadena del lenguaje posee una nica estructura entonces la gramtica es no
ambigua. En cambio si existe al menos alguna cadena del lenguaje con ms de una
estructura (rbol de derivacin) entonces la gramtica es ambigua.
Ejemplo:
E E+E | E E | (E) | id
2-
id
id
id
id
id
id
E E+E id + E id + id (d mi )
E E+E E + id id + id (d md )
E
E
id
id
La multiplicidad de derivaciones no es la causa de la ambigedad. La causa es la existencia
de 2 o mas rboles de derivacin para una cadena w en T* (por eso se sugiere escoger d mi
o d md para verificar ambigedad).
Teorema: para toda G = (V, T, P, S) y toda cadena w en T*, w tiene 2 rboles de derivacin
distintos si y solo si w tiene 2 derivaciones mas a la izquierda distintas desde S.
Para detectar la ambigedad de las gramticas no existe un algoritmo que nos diga si una
gramtica es o no ambigua. Las causas de la ambigedad son:
-No se respeta la presencia de los operadores, necesitamos forzar que la
estructura sea nica.
-No se tiene una convencin (izquierda o derecha) para agrupar operadores
idnticos (E + E * E), la convencin es por la izquierda.
Una tcnica que puede eliminar la ambigedad, consiste en introducir nuevas variables con
el nivel de agrupamiento siguiente:
1- F Factor
-Identificador
-Expresin con parntesis
-productos de 2 ms factores.
cualquier cosa.
Ejemplo: la gramtica ambgua anterior S S+S | S S | (S) | id, puede sustituirse por su
equivalente no ambgua:
S S+T|T
Prof. Hilda Contreras Teora de la Computacin (Pregrado)
T T*F|F
F (S) | a
Ambigedad inherente:
Se dice que un Lenguaje Libre de Contexto es inherente ambiguo si todas las
gramticas que presentan ese lenguaje son ambiguas. Estos lenguajes existen aunque son
difciles de imaginar.
Un LLC es inherente ambiguo si todas las gramticas son ambiguas.
Simplificacin de Gramticas Libres de Contexto
123-
Eliminar producciones
Eliminar producciones unitarias
Eliminar los smbolos intiles
1- Eliminar producciones ( A a )
Primero se revisa si el lenguaje contiene a la cadena vaca :
Si no est en L no necesitamos producciones, por tanto aplicamos el algoritmo.
Si en L, entonces generamos una GIC para L {} y despus al final hacer que:
G = ( V U {S}, T, P, S) y V I S = y P= P U (S a S | )
Existe un algoritmo para detectar smbolos nulificables
A es nulificable si A
Si A en P entonces A es nulificable
Si A en P y todos los smbolos de son nulificables A es nulificable.
ALGORITMO para eliminar producciones :
INICIO
i= 0
N 0 = {A | A una P y A en V}
REPETIR
i= i +1
N i = N i 1 U {A | A en P y en (N i 1 )+}
HASTA (N i = N i 1 )
P= Si A a X1 X2 Xn en P, entonces agregamos a P las producciones A a 12n:
FIN
Si X i no esta en N i entonces i = Xi
Si X i esta en N i entonces i = Xi o i =
No todos los i son
A CD
B Cb
C a|
D bD |
Calcular N i
N 0 = {C, D}
N 1 = N 0 U{A} = {C, D} U{A} = {C, D, A}
N 2 = N 1 U = {C, D, A} U = {C, D, A}
P=
2- S=
A= {C, D}
Prof. Hilda Contreras Teora de la Computacin (Pregrado)
B=
C=
D=
3- Pares (A, C), Como C a y A C entonces A a
(A, D), Como D bD y D b y A D entonces A bD y A b
A a
4- P = P1 U
A bD y A b
A C
-
A D
(1)
VV = {A, S}
VN = {A, S} U {A, S} = {A, S}
Parada (VV = VN) {A, S} = {A, S}
V= {A, S}
P=
S a
A a
2- VV = {S, A}
TV = {a}
VN = {S, A}
TN = {a}
V = {S, A}
T = {a}
P =
S Aa | a
Aa
Prof. Hilda Contreras Teora de la Computacin (Pregrado)
10
Teorema: Si eliminamos
1 los smbolos que NO son generadores X * w, para algn w en T*
2 los smbolos que NO son alcanzables S X para algn y en (V U T)*
Solo quedan los smbolos tiles de la GLC.
Formas Normales de las GLC
Forma Normal de Chomsky (FNC) (Chomsky, 1959)
Una gramtica GLC, esta en la FNC si cada una de sus producciones es de los tipos
siguientes:
A BC
A a
Donde A, B y C son variables (en V) y a es un smbolo Terminal (en T)
Teorema: Cualquier GLC sin -producciones puede ser transformada a una gramtica
equivalente en donde las producciones son de de la forma A BC o A a
Antes de aplicar el algoritmo hay que eliminar:
1- producciones
2- producciones unitarias
3- smbolos intiles.
ALGORITMO para llevar a la Forma Nornal de Chomsky
INICIO
Sea A X1 X2 Xm en P
1- Crear producciones del tipo A a adecuadamente
Si Xi es Terminal y Xi = a entonces agregamos a P la produccin Ca
por Ca. Entonces todas las producciones son de forma:
A B1B2 Bm y A a
a y remplazamos Xi
S bA | aB
A bAA | aS | a
B aBB | bS | B
Prof. Hilda Contreras Teora de la Computacin (Pregrado)
11
(1)
(2)
A a
S C b A | CaB
A CbAA | CaS | a
B CaBB | CbS | b
Ca a
Cb b
S C b A | CaB
A CbD1 | CaS | a
B CaD2| CbS | b
D1 AA
D2 BB
Ca a
Cb b
A
B1
B2 Bm
B1 D1; D1 B 2 D 2 ;
D2
B 3 D 3 ; D m 2 B m 1 B m 2
A
B1
D1
B2
D2
B3
.
D3
.
.
.
D m2
B m 1
Bm
12
A a, donde a en T y esta en V*
El cuerpo de las producciones comienzan con un Terminal y puede seguirla cualquier
cantidad de variables (inclusive 0 variables)
Su importancia radica en que, la FNG genera smbolos terminales por cada forma sentencial
(==>), entonces una cadena de longitud n tiene exactamente n pasos de derivacin en esta
GLC, su derivacin depende directamente del tamao de la entrada (obtener una GLC en
la FNG es costoso computacionalmente). Adems una forma normal de Greybach permite
generar Autmatas de Pila sin reglas (es decir, transiciones espontneas).
PRECONDICION: Se comienza con una gramtica en FNC.
Notas: Para aplicar el algoritmo cada variable se etiqueta en un conjunto ordenado de
variables (con subndices en secuencia). Por ejemplo, Si V = {S, A, B}, entonces V = {A1, A2, A3}.
La cardinalidad de V es llamada m, es decir m es el nmero de variables de la GLC.
Truco: Se busca enumerar con el valor ms alto (K = 3) a una variable con alguna
produccin de la forma A a
ALGORITMO para llevar a la Forma Normal de Greybach (FNG).
INICIO
Paso 1: Convertir todas las producciones de una variable en la FNG
PARA K= m a 1 HACER
PARA J=1 a K-1 HACER
PARA Cada produccin de la forma Ak Aj HACER
PARA Todas las producciones Aj
HACER
Agregar producciones Ak
FINPARA
FINPARA
Remover produccin Ak Aj
FINPARA
SI existe Ak Ak ENTONCES
PARA Cada produccin de la forma Ak Ak HACER
Agregar produccin Bk y Bk Bk
FINPARA
Remover produccin Ak Ak
Agregar la produccin Ak Bk
FINPARA
FINSI
FINPARA
Paso 2: Convertir todas las producciones: Las reglas de la forma Aj a se sustituye
en las reglas de P hasta que todas sean FNG.
FIN
13
Ejemplo: Dada la GLC G siguiente se quiere obtener una GLC equivalente en la FNG:
G = ({A1, A2, A3}, {a, b}, P, A1)
P = A1 A2A3
A2 A3A1| b
A3 A1A2| a
Paso 1:
K = 3 , la variable A3
J=1
A3 A2A3A2 | a
A2 A3A1 | b
A1 A2 A3
J=2
A1 A2A3
A2 A3A1 | b
A3 A3A1A3A2 | bA3A2 | a
A1 A2A3
A2 A3A1 | b
A3 bA3A2 | a
B3 A1A3A2| A1A3A2B3
A1 A2A3
A2 A3A1 | b
A3 bA3A2 | a | bA3A2B3 | aB3
B3 A1A3A2| A1A3A2B3
Paso 2:
Derivacin
+ izq
rbol de
Derivaci
14
Derivacin
+der
Inferencia
Recursiva
Derivacin
A = GLC = (V, T, P, S)
Si w esta en L(A) entonces existe un rbol de derivacin con raz A y resultado w.
Si A w entonces
A
(---w---)
Si A w entonces
X1
A
X2
Xk
A X 1 X 2 X k
X i w i i=1... k
Ejercicios:
1) Encuentre la GLC para
a.- {a b , i j}
i
b.- {a b c , i = j+k}
k
15
9) La siguiente GLC genera un lenguaje regular pese a no serlo ella misma. (a) Encuentre una
Gramtica Regular que genere el lenguaje generado por:
G = ({S}, {a,b}, {S SSS | a | ab},S)
(b) D la expresin regular del lenguaje L(G)
(c) Genere una cadena del lenguaje L(G) de tamao mayor que 3 y muestre su rbol de
derivacin a partir de la GLC.
16
10) Escriba una GLC G que genere todas las posibles Gramticas libres de contexto sobre
el alfabeto {a,b} y que usan las variables S,A y B. Cada posible GLC es una secuencia de
producciones separadas por comas, entre parntesis y usando el smbolo igual = para
indicar el smbolos de produccin . Por ejemplo, una cadena generada por G es
(S=ASB,A=a,B=b,S=). Indique claramente cuales son los smbolos terminales de G. Nota:
Asuma que G puede generar reglas repetidas, es decir no necesita validar que la
produccin ya fue derivada anteriormente, por tanto la cadena (S=Aa,A=b,S=Aa) es igual a
la cadena (S=Aa,A=b).
11) Dadas las etiquetas <?xml version=1.0?>, <a1>, <a2>, <a3>, </a1>, </a2> y </a3>,
escriba una GLC G que genere todas los posibles archivos XML bien formados con
dichas etiquetas. Un archivo XML est bien formado si: (a) Tiene un solo elemento raz, (b) La
ultima etiqueta que abre es la primera que cierra, (c) El texto de los elementos no contiene
ninguna de las cinco entidades &, <, >, , , excepto si esta encerrado entre un CDATA ( abre
con <![CDATA[ y cierra con ]>).(d) Los comentarios abren con <!y cierran con -->. Nota: no
considere la ocurrencia de atributos en los elementos o etiquetas. Indique claramente los
terminales y variables de su GLC
12) Encuentre una GLC equivalente en la Forma Normal de Greibach (FNG) de la siguiente
GLC G = ({S,A,B,C},{0,1},P,S), Justifique sus pasos:
S 0A0 | 1B1 | BB
AC
BS|A
CS|
13) Dada la siguiente GLC G encuentre una GLC G` en la FNG (Forma Normal de Greibach):
G = ( V, T, P, S )
V = { S, A, B }
T= {a,b}
P = S ABa | A
A aA |
B bB |
17