Вы находитесь на странице: 1из 10

Bsqueda online y optimizacin: El juego de las cifras

Formalizacin del problema:


Representacin (eficiente) de estados:
(<ltimo resultado>,<lista de los nmeros disponibles todava>)

Estado inicial: (0,[6,2,5,25]) Estado meta: (x,y) tal que x es lo ms cerca posible de 420 Operadores: aplicar la suma/multiplicacin Coste de un operador: 0 Tipo de solucin: estado

Se puede resolver el problema con un mtodo de bsqueda no informado usando como estado meta (420,y), pero Que pasa si no hay ninguna solucin exacta? Mejor utilizar la bsqueda online:
Funcin heurstica: h*((x,y))=|420-x|
mide la similitud del estado al objetivo, no mide el coste del camino restante

Modificar los algoritmos:


se termina cuando el estado elegido como ms prometedor tiene un valor de h* mayor que el estado actual
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Bsqueda con horizonte: El juego de las cifras


mtodo base: bsqueda en profundidad limitada estado actual = (0,[6,2,5,25]) horizonte k = 2 (6,[2,5,25]) (8,[5,25]) (6+2) (31,[2,5]) (6+25) (0,[6,2,5,25])

h*=420
(25,[6,2,5,25]) (31,[5,2]) (25+6) (27,[6,5]) (25+2)

(2,[6,5,25]) (27,[6,5]) (2+25)

(5,[6,2,25])

(8,[5,25]) (2+6)

(11,[2,25]) (30,[6,2]) (5+6) (5+25)

(11,[2,25]) (12,[5,25]) (6+5) (6*2) (150,[2,5]) (30,[2,25]) (6*25) (6*5)

(7,[6,25]) (12,[5,25]) (7,[6,25]) (30,[2,25]) (2+5) (2*6) (5+2) (5*6) (50,[6,5]) (10,[6,25]) (125,[6,2]) (10,[6,25]) (2*25) (2*5) (5*25) (5*2)

(30,[6,2]) (150,[5,2]) (25+5) (25*6) (50,[6,5]) (125,[6,2]) (25*2) (25*5)

h*=270
k=2

Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Bsqueda con horizonte: El juego de las cifras


mtodo base: bsqueda en profundidad limitada estado actual = (6,[2,5,25]) horizonte k = 2 (8,[5,25]) (13,[25]) (8+5) (40,[25]) (8*5) (33,[5]) (8+25) (200,[5]) (8*25) (31,[2,5]) (36,[2]) (31+5) (155,[2]) (31*5) (33,[5]) (31+2) (62,[5]) (31*2) (6,[2,5,25]) (11,[2,25]) (36,[2]) (11+25) (275,[2]) (11*25) (13,[25]) (11+2) (22,[25]) (11*2)

h*=414
(150,[2,5]) (152,[5]) (150+2) (300,[5]) (150*2) (155,[2]) (150+5) (750,[2]) (150*5) (30,[2,25]) (55,[2]) (30+25) (750,[2]) (30*25) (32,[25]) (30+2) (60,[25]) (30*2)

(12,[5,25]) (37,[5]) (12+25) (300,[5]) (12*25) (17,[25]) (12+5) (60,[25]) (12*5)

h*=120
k=2
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Bsqueda con horizonte: El juego de las cifras


mtodo base: bsqueda en profundidad limitada estado actual = (12,[5,25]) horizonte k = 2 (37,[5]) (185,[]) (37*5) (42,[]) (37+5) (12,[5,25]) (300,[5]) (1500,[]) (300*5) (305,[]) (300+5)

h*=408
(17,[25]) (425,[]) (17*25) (42,[]) (17+25) (60,[25]) (1500,[]) (60*25) (85,[]) (60+25)

h*=5
k=2
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Bsqueda con horizonte: El juego de las cifras


mtodo base: bsqueda en profundidad limitada estado actual = (17,[25]) horizonte k = 2 (17,[25]) (42,[])

h*=403
( 425,[])

h*=5

k=2
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Bsqueda con horizonte: El juego de las cifras


mtodo base: bsqueda en profundidad limitada estado actual = (425,[]) horizonte k = 2 (425,[])

k=2
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Ejercicio 2.13
Bsqueda online para optimizacin: Juego de las cifras
La bsqueda online para optimizacin (parando cuando no se obtiene ninguna mejora) es muy til en problemas de optimizacin con un nmero infinito de estados. Aplica la bsqueda por ascenso de colinas a la siguiente instanciacin del juego de las cifras: CIFRAS: 2, 3, 5, 7, 8 EXACTO: 163 En este caso, se usan los operadores suma, resta, multiplicacin y divisin. Solo se puede aplicar un operador si el resultado es entero positivo. Cada cifra se puede utilizar varias veces.

Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Tema 2: Juegos unipersonales

Resumen:
2. Juegos unipersonales 2.1. Representacin bsica 2.2. Juegos con informacin completa 2.3. Recursos limitados en juegos con informacin completa 2.4. Juegos con informacin incompleta Bsqueda en tiempo real Bsqueda A* con aprendizaje en tiempo real

Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Caractersticas de problemas con informacin incompleta


Entorno:
secuencial (acciones se efectan de forma secuencial) discreto (nmero finito de acciones en cada estado) determinista (resultados de las acciones son estados definidos) accesible (se puede percibir el estado actual y comprobar si es estado meta)

Agente:
Es capaz de percibir el estado en el que se encuentra Conoce las acciones que puede aplicar en el estado actual
Pero no conoce los estados sucesores de un estado hasta que no ha probado las acciones correspondientes (no puede prever los estados resultantes de las aciones)

Tiene un objetivo (estado meta) Suposiciones:


Las acciones son deterministas (el resultado de una accin, aunque no es previsible, est claramente definido y no cambia) El agente puede reconocer siempre un estado que ha visitado anteriormente
2
Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Conocimientos mnimos a priori de un agente


Conocimientos mnimos a priori de un agente de bsqueda en el espacio de estados:
s0 acciones: s {a1, ..., an} meta?: s verdad | falso Estado inicial Devuelve una lista de acciones permitidas en el estado s Compara el estado s con los estados meta y devuelve verdad si s es un estado meta Coste del operador a para ir de si a sj solo se puede aplicar si se conoce sj

c: (si, a, sj ) v, v

c si1 si2 sin = c sik , ak , sik +1


k =1

n 1

)
2

Coste de un plan

Fundamentos de Inteligencia Artificial 3 Ing. Sup. Inf

Вам также может понравиться