Академический Документы
Профессиональный Документы
Культура Документы
clase.
1. TÍTULO
La inteligencia artificial es uno de los temas más populares en el mundo por su gran avance
ya que por medio de ella se tendrá un futuro prometedor para algunas personas pero no
para otras, donde algunas aplicaciones que se desarrollaran no serán de su agrado debido a
que reemplazará en el ámbito laboral al ser humano, como otras que si serán de gran
alcance como las apps de salud, de aprendizaje que se comprometen con el buen desarrollo
tanto social como cultural de la humanidad en general; del mismo modo la tecnología en
general está cambiando la forma de ver el mundo, todo esto gracias a los avances
científicos que han venido transcurriendo a través del tiempo y por ende a los creadores o
especialistas de motores, robots y otros sistemas automatizados en la inteligencia
artificial(IA), puesto que su trabajo es el de desarrollar ciertos programas y algoritmos
que contribuyan con el funcionamiento seguro y correcto de las mismas, teniendo en
cuenta también que esto conlleva a desarrollar algoritmos que permitan el aprendizaje y
razonamiento de las máquinas, si bien uno de los objetivos de la IA es determinar si las
máquinas pueden llegar a pensar como los seres humanos en algunos aspectos,
demostrándose con el test de Turing (Domínguez Estévez, 2017).
En caso de los videojuegos, estos sirven para el análisis y estudio de los algoritmos
provenientes de la inteligencia artificial, es allí donde se encuentran todo tipo de errores
como soluciones óptimas que hace posible la creación de muchas aplicaciones que hacen
la vida del ser humano lo más fácil posible, ya sea el realizar una app que permita la
conducción de un auto automáticamente sin tener conductor al volante (Domínguez
Estévez, 2017).
Desde que surgió la informática se ha venido desarrollando una mayor autonomía sobre la
misma, demostrando por medio de algoritmos que se es capaz de aprender y adaptar a sus
cambios en el transcurso del tiempo. En cuanto a los videojuegos desarrollándose en el
campo de la inteligencia artificial podemos decir que esta limitada a ciertos
comportamientos delimitados por un diseñador dando campo a personajes virtuales no
carentes de autonomía. Del mismo modo, el aprendizaje por refuerzo promete técnicas
ofreciendo la posibilidad de crear agentes que obtengan aprendizaje por sí mismos.
Teniendo en cuenta que dichos agentes están empezando en el ambiente de los videojuegos
aún no tienen la capacidad de estar explorados en su totalidad en este campo (Deltell
Mendicute, Lorente Sánchez & Martínez Dotor, 2015).
En este proyecto intentaremos desarrollar una aplicación que mediante este algoritmo sea
capaz de aprender a hacer ciertas actividades por sí mismo en el entorno del juego de
estrategia en tiempo real (RTS, del inglés Real-Time Strategy Games) StarCraft. En
concreto, lo emplearemos para la resolución de laberintos de forma autónoma, es decir, sin
proporcionarle conocimiento previo al agente sobre la estructura del laberinto. Para ello
iremos moviendo a una unidad del juego por un laberinto que podrá contener trampas, y
mediante aprendizaje por refuerzo lograremos que dicha unidad sea capaz de encontrar la
salida por sí misma (Deltell Mendicute, Lorente Sánchez & Martínez Dotor, 2015).
A través de los años, la inteligencia artificial ha venido creciendo de una forma asombrosa
considerándose un apartado importante en el mercado mostrando un crecimiento
exponencial. El solo darnos cuenta que en el pasado o años antes de cristo, el solo pensar
que podrían existir un robot que trabajaba y que desarrollara inteligencia similar a la del
ser humano se entendía sólo como ciencia ficción incluso hoy en día se ve muchas
películas de esta temática, donde se demuestra hasta dónde puede llegar la inteligencia
artificial. Del mismo modo, se ve y se analiza el riesgo que se toma en caso de que no se
cumplan las tres reglas de la robótica; pero si se toma precaución a la hora de la creación se
puede decir que traerán consigo un futuro prometedor (Romero Reviriego, 2019).
En el aprendizaje por refuerzo es aprender qué decisión se debe tomar en cada situación
todo esto para aumentar su recompensa, bien sea tratándose de un valor numérico. El
agente encargado de realizar el aprendizaje no tiene conocimiento de las pruebas que se le
realizará, pero debe analizar y descubrir qué recompensa es mayoritaria en su uso. El
tomar la decisión correcta hace que afecte la recompensa inmediata, si no que al mismo
tiempo afecta también la siguiente situación y así sucesivamente las siguientes situaciones
que se obtendrán de ahí en adelante durante el proceso (Romero Reviriego, 2019).
Las dos características más importantes que diferencia de otras a la IA son la búsqueda por
prueba y error, en esta el agente realiza diferentes pruebas verificando cual otorga mayor
recompensa y la recompensa retrasada solo se interesa por obtener un final con una
recompensa mayor incluso si se tiene que sacrificar parte de la recompensa inmediata
tomando otra acción en alguno de los estados (Romero Reviriego, 2019).
El aprendizaje por refuerzo es el medio por el cual se permite a dichos sujetos aprender por
medio de una realimentación propiciado por el mismo entorno, siendo una idea propia e
inspirada por la naturaleza en la misma forma en la que el ser humano y los animales
aprenden llamado conductismo ( estudia las conductas y comportamientos)
experimentando y probando diversas cosas u objetos, observando qué ocurre, si las cosas
van bien entonces se aplicará nuevamente el mismo comportamiento y si van mal se
tenderá a evitar, estas ideas se pueden usar para que un robot aprenda a crear un
controlador para que se auto programe y no tener que programarlo (De Lope, 2008).
Básicamente un controlador de un robot asocia los estados con las acciones debido a que
los estados vienen determinados por la información sensorial adquirida por el entorno, bien
sabiendo que las acciones dependen de los mecanismos activadores que tenga el robot; con
el aprendizaje por refuerzo, el robot pone en práctica varias acciones que tiene disponible
en cada uno de los estados en los que se encuentra, registrando cada uno de los sucesos que
transcurren a través de su comportamiento. De hecho, el RL implica adquirir e incorporar
nuevo conocimiento y habilidades mejorando siempre el rendimiento de los agentes en el
entorno que lo rodea, también consiste en aprender que hacer, como asociar las diversas
situaciones con las acciones maximizando su recompensa numérica, dándole la
oportunidad al agente de descubrir que está haciendo bien y que está haciendo mal por
medio de las pruebas de ensayo y error, observando que cualquier método que resuelva ya
es un aprendizaje más para el individuo (De Lope, 2008).
Figura 1: Merino, M. (2019). Conceptos de inteligencia artificial: qué es el aprendizaje por
refuerzo.
¿Qué consecuencias ha traído el no contar con material educativo para el aprendizaje por
refuerzo?
¿Qué estrategias son las que darán solución a la realimentación del aprendizaje por
refuerzo?
ESPECÍFICOS
● Identificar los factores que están afectando el aprendizaje de la técnica de
aprendizaje por refuerzo.
● Establecer una metodología que permita a los estudiantes tomar en sus clases el
aprendizaje por refuerzo.
● Elaborar material didáctico como estrategia para mejorar el aprendizaje del tema
aprendizaje por refuerzo en el ámbito de la inteligencia Artificial.
JUSTIFICACIÓN
Lo que se propone es darle una solución válida que disminuya los ítems del mal
aprendizaje en la técnica aprendizaje por refuerzo y que permita a los estudiantes tener una
buena técnica de aprendizaje.
OBJETIVOS
GENERAL
Gestionar material educativo que permita a los estudiantes del programa de ingeniería de
sistemas de la universidad de Boyacá, a adquirir el conocimiento sobre la técnica
“aprendizaje por refuerzo”.
ESPECÍFICOS
MARCO REFERENCIA
Marco Teórico:
Marco Legal:
1. Un robot no hará daño a un ser humano ni, por inacción, permitirá que un ser
humano sufra daño.
2. Un robot obedecerá las órdenes dadas por los seres humanos, excepto si estas
órdenes entran en conflicto con la primera ley.
3. Un robot debe proteger su propia existencia siempre que ella no entre en conflicto
con la primera o segunda ley.
Marco Geográfico:
Marco Histórico:
DISEÑO METODOLÓGICO
Línea de Investigación
Estudios Exploratorios: Se iniciará con una exploración del pensul educativo del área
en general, ámbito en que se llevará a cabo el estudio en general sobre la materia
Inteligencia artificial.
Estudios Descriptivos: En este apartado se hará la breve descripción de los datos que
se recolectan en las fases que se realizarán en el transcurso de que se inicie el proyecto
para mejorar el material educativo de aprendizaje por refuerzo de inteligencia
artificial.
Estudios Explicativos: Se realizará este proyecto debido a que cada día se ve afectado
el aprendizaje de los estudiantes en el aprendizaje por refuerzo. Además, se requiere
que por medio del material didáctico se logre apoyar la técnica de aprendizaje por
refuerzo para que mejore la calidad de aprendizaje tanto de los estudiantes como el de
los profesores.
Estructura metodológica
Capítulo 2. Establecer una metodología que permita a los estudiantes tomar en sus
clases el aprendizaje por refuerzo.
Capítulo 3. Elaborar material didáctico como estrategia para mejorar el aprendizaje del
tema aprendizaje por refuerzo en el ámbito de la inteligencia Artificial.
Resultados esperados
Con este anteproyecto se espera contar con una herramienta que permita hacer un
seguimiento del aprendizaje por refuerzo, poniendo en evidencia que la asignatura que
dicta este tema o técnica es la inteligencia artificial y sabemos que no se cuenta con
material educativo que permita que se pueda volver enseñar, facilitará establecer cómo
estará día a día nuestro entorno en Tunja o en cualquier otro lugar donde se pueda
implementar. También se elaborará un material didáctico y educativo que permita a la
comunidad estudiantil de la universidad de Boyacá aprender dicho tema para reforzar
todo el tiempo perdido y cómo podemos aportar para reducir y controlar los problemas
causados por la falta de la técnica.
Impacto ambiental
Se tiene previsto que con este proyecto no puede haber ninguna situación que sea
perjudicial al medio ambiente ya que el impacto que esto pueda causar es mínimo, debido a
que solo tiene acceso aquellas personas especializadas en el tema sobre la inteligencia
artificial y sus derivados en este caso la técnica de aprendizaje por refuerzo.
Consideraciones éticas
Presupuesto
Lo que se quiere es tener un patrocinador que permita desarrollar el proyecto y porque no, a
futuro el proyecto para que sirva de soporte ante cada una de las etapas que se tendrán en
cuenta a través del tiempo y así poder darle a la comunidad estudiantil.
▪ Recursos institucionales:
No existe institución alguna por el momento que apoye el proyecto.
▪ Recursos humanos:
Investigadores son los estudiantes de ingeniería de sistemas Blanca Janeth Gomez con los
asesores del anteproyecto leidy Johana docente encargada de la asignatura donde se lleva a
cabo el anteproyecto.
▪ Recursos materiales:
- Manejo de encuestas.
- Recopilación de muestras.
- Tabulacion de informacion.
- Mano de Obra.
- Aplicación de seguimiento.
Presupuesto Global
RUBROS AÑO 1
EFECTIVO ESPECIE
Honorarios 1.800.000
Software 1.500.000
Subtotal
Total
Cronograma
TIEMP M
O a
A M J J A S O N D
r
b a u u g e c o i
ITEM .
r y n l o p t v c
ACTIVIDAD /
. . . . . . . . .
2
0
1 Obj. -Identificar los factores que X X
están afectando el aprendizaje X X X X
de la técnica de aprendizaje
por refuerzo.
Análisis de requerimientos e
fase 1
Investigaciones existentes.
Domínguez Estévez, F. (2017). Entrenando bots para juegos mediante aprendizaje por
refuerzo basado en casos. Tomado de: https://bit.ly/2lWrScT [Acceso 9 septiembre. 2019].
Deltell Mendicute, J., Lorente Sánchez, A., & Martínez Dotor, J. (2015). Resolución de
laberintos en StarCraft empleando aprendizaje por refuerzo. Tomado de:
https://bit.ly/2lUvCM0 [Acceso 9 septiembre. 2019].
Ruiz-Montiel, M., Mandow, L., & Pérez de la Cruz, J. (2013). PQ-learning: Aprendizaje por
refuerzo multiobjetivo. Tomado de: from https://bit.ly/2miLpog [Acceso 9 septiembre. 2019].
Martín H, J., & Ruiz, J. (2004). Formalización de maniobras en robots con múltiples grados de
libertad como sistemas multiagente. Tomado de: from https://bit.ly/2klv1CT [Acceso 9
septiembre. 2019].