A Symbiotic Brain-Machine Interface Through Value

Inteligencia Artificial
Introduccin
El objetivo de disear una interfaz cerebro-maquina (BMI) es el de establecer un control directo y un canal de comunicacin entre el sistema nervioso central y los dispositivos protsicos que funcionan entorno al usuario.
Concepto
Se divide en 3 partes.
Arquitectura del control BMI
Decodificacin de la arquitectura y el desarrollo de la teora de la formacin de la misma.
Neurofisiologa
Aspectos neurofisiolgicos de valor y demostrar cmo se puede utilizar en la arquitectura computacional
Simulador de bucle cerrado y Descifrando simultaneo utilizando M1 y NACC

Introduccin de un conjunto de experimentos para probar la funcionalidad de la SBMI.
a. BMI, Arquitectura del Control

Se puede construir sobre la Teora de Procesos de Decisin de Markov (MDP) y automatizados que utilicen el mtodo de aprendizaje. Se buscan sistemas de AccinResultado dando un valor alto a las que producen recompensas deseables. Es importante buscar tcnicas en tiempo real para el modelado y valoracin de acoplamiento entre el usuario y el ndice de masa corporal.
El actor se impulsa por la corteza primaria St y su principal funcin es seleccionar acciones ai en el medio ambiente. Se evalan por el critico, que proporciona una seal de error basado en el gradiente de expectativa de recompensa Vt. Se utiliza para adaptar los parametros para la eleccion de acciones que conducen a la recompensa. El acoplamiento es intrinseco entre el motor, el sistema de recompensa y el medio ambiente.
Problema 1 Integrar mejores mtodos en tiempo real de procesamiento de seal capturada. Problema 2 Estimar los valores de la funcin estatal de accin para evaluar acciones futuras.
Diagrama conceptual de modulacin recompensa expectativa de que el usuario basndose en las acciones IA.
La estructura temporal de la actividad neuronal NACC indica la expectativa de recompensa o aversin en las tareas dirigidas meta. El crtico debe interpretar esta actividad y transformarla en una seal de error escalar.
Actor estructura.
b. Neurofisiologa
Primero se deba analizar la retroalimentacin evaluativa en el mismo cerebro y adecuarla a una seal de entrenamiento para la arquitectura S-BMI.
Neurociruga estereotxica se utilizan para orientar la NACC y M1. En los experimentos con grabacin simultnea de NACC y M1, un conjunto de electrodos dual fue implantado.
Vista superior de la caja del comportamiento animal. El dedo en la nariz los rayos infrarrojos iniciado la seleccin aleatoria de un nivel objetivo desencadenado por una luz (LED). El animal tena un mximo de 4 segundos para presionar una palanca. Si la palanca correcta se ha pulsado, una recompensa de agua fue entregado.
C. Simulador de bucle cerrado Es el primer paso para probar la

funcionalidad de la arquitectura. Simula cambios ambientales e insumos con caractersticas conocidas. Se compone de 3 mdulos: Sintetizador de disparo neuronal, controlador del actor-critico y el medio ambiente. Se proyecto un medio ambiente 2D y la tarea era navegar un brazo robot desde el medio a cualquier objeto en el espacio 2D.
d. Descifrado simultneo utilizando M1 y NACC

Se realizo un experimento modificando los anteriores. El robot estaba delante de la jaula de la rata, dos palancas de los lados izquierdo y derecho del espacio de trabajo del robot se utilizaron como dianas. El objetivo distal fue desencadenado por la luz (LED) y la tarea consista en navegar por el robot a la meta distal. Una vez que el robot alcanzado el objetivo, una recompensa de agua fue entregado a la rata.
Resultados
Se debe cuantificar las propiedades y el rendimiento en las siguientes reas.

Propiedades
temporales de la seal de retroalimentacin evaluativa de NACC que se utilizarn para entrenar la red Propiedades de convergencia del actor-crtico durante los cambios ambientales El efecto de la reorganizacin neural en la generalizacin del actor-crtico El uso simultneo de M1 real y la actividad NACC en la descodificacin
a. Propiedades temporal de la actividad NACC

Cmo prepararse para recompensar
Se realiz el anlisis estadstico para identificar las neuronas de cada grupo cuantitativamente. Para cada neurona se compar la actividad de referencia (2 segundos antes de que la seal como se indica por la barra roja)
El resultado de nuestro estudio neurofisiologa sugiri que existe una representacin hetereogeneous y rica de informacin objetivo en el NAcc durante comportamiento meta-enfoque.
b. Convergencia del actor-crtico durante los cambios ambientales
Una de las ventajas principales de la arquitectura Actorcrtico es que est diseado para adaptarse simbiticamente con el usuario durante los cambios ambientales.
c. La reorganizacin de la representacin neural
La plasticidad del cerebro es un factor importante en el diseo de ndice de masa corporal y se ha observado en el contexto de muchas reas de investigacin
d. Robot de control utilizando simultneamente M1 y NACC
En esta seccin, se utiliz la actividad neural NACC que se registr simultneamente con M1 para navegar por un brazo robtico en el espacio 3-D.
(A) recompensa acumulativa en el tiempo. (B) Los valores calculados de accin en el nivel de salida del Actor. Cada color representa el valor de una accin especfica. Aqu, el rojo corresponde a la accin que navega el robot en un camino directo hacia el objetivo. (C) La salida de los 3 elementos ocultos capa de procesamiento del Actor. Aumentar la adaptacin de los valores se produce antes de que el "codo" de la curva de acumulacin de recompensas.
Discusin
A continuacin se proceder a mencionar 2 trabajos de investigacin relacionados a este para finalmente discutir las similitudes, diferencias y el aporte de los mismos.
Prerequesites for Symbiotic Brain-Machine Interfaces
Justin C. Sanchez Depts. of Pediatrics, Neuroscience, and Biomedical Engineering University of Florida Gainesville, USA jcs77@ufl.edu
Jose C. Principe Department of Electrical and Computer Engineering University of Florida Gainesville, USA principe@cnel.ufl.edu
Resumen
Avances recientes en la neurociencia y la ingeniera de Interfaces de Mquina cerebral proporcionan un tipo de nuevos diseos co-adaptables basados en el refuerzo, aprendiendo de el cambio la naturaleza, de la capacidad de un usuario de lograr las tareas que no eran metodologas posibles estticas que usan. Diseando mandos adaptables e inteligencia artificial en el interfaz de los nervios, los ordenadores pueden hacerse ayudantes activos en el comportamiento dirigido por objetivo y ms lejos realzar el funcionamiento humano. Esta investigacin presenta un juego de los requisitos previos mnimos que permiten una simbiosis cooperativa y el dilogo entre sistemas biolgicos y artificiales.
Visin para Siguiente Generacin en la interaccin maquina-cerebro

El comportamiento inteligente proviene de las acciones de un individuo que procura maximizar la recompensa recibida en un complejo y el mundo que se cambia Ciclo de Accin-percepcin: Proceso adaptable, continuo de usar informacin sensorial para dirigir una serie de acciones dirigidas por el objetivo.
Antecedentes
Comportamiento
Concecuencias
Requisitos para la simbiosis y BMI co-adaptativo.
Brain-Computer Interfaces for Non-Medical Applications: How to Move Forward
Jan B. F. van Erp TNO Department Perceptual and Cognitive Systems Kampweg 5 PO Box 23 3769ZG, Soesterberg The Netherlands phone: +31888665982 fax: +31346353977 email: jan.vanerp@tno.nl Michael Tangermann Berlin Institute of Technology FR6-9 Franklinstr. 28/29 10587 Berlin Germany email: michael.tangermann@tu-berlin.de
Fabien Lotte Institute for Infocomm Research, Singapore Singapore Present address: Inria Bordeaux Sud-Ouest 351 cours de la libration, 33400 Talence France email: fabien.lotte@inria.fr
Introduccin
Los Interfaces de Ordenador cerebral (BCIs) llevan la promesa de interaccin natural e intuitiva hombremquina. Mientras la mayor parte de tecnologa BCI fue desarrollada para usos mdicos, identificamos 7 usos no mdicos incluyendo el control de dispositivo, el estado de usuario la supervisin y el juego. Requieren brechas en las reas de utilidad, hardware y software, y la integracin de sistema, pero para el desarrollo acertado tambin debera tomar caractersticas de usuario y aceptacin en consideracin.
Control de dispositivos
Utilizar una interfaz cerebro-maquina puede facilitar en gran medida el uso de dispositivos variados.
Supervisin de estado de usuario

Los futuros interfaces de sistema de usuario tienen que ser capaces de entender y esperar el estado del usuario y las intenciones del usuario.
Evaluacin
Los usos de evaluacin pueden ser usados en una manera en lnea (por la supervisin constante) y una manera autnoma.
Training and educacin

La medicin de esta plasticidad y cambios del cerebro puede ayudar a mejorar mtodos que se entrenan en general y la lista de educacin de un individuo en particular.
Juegos y entretenimiento
La industria del entretenimiento puede realizar avances significativos en el rea debido a los videojuegos que cada da incorporan mas conectividad entre el usuario y el dispositivo.
Mejora cognoscitiva
La presentacin optimizada de aprender el contenido. Aunque haya actualmente la falta de datos buenos experimentales sobre sus efectos, el tamao de efecto es probablemente pequeo y limitado con tareas especficas cognoscitivas.
Seguridad y proteccin
En un escenario imaginado un observador o los observadores mltiples estn viendo grabaciones de CCTV o exploraciones de equipaje para detectar desviaciones (sospechoso o criminal) o comportamientos objetos.
Discusin
Durante las actividades de la vida diaria, el ndice de masa corporal debe ser capaz de tener un buen desempeo en las tareas complejas en condiciones de entornos dinmicos y la activacin neuronal. En este trabajo, hemos desarrollado un nuevo marco para lidiar con estas condiciones en las que dirigidas a un fin BMI evolucionan con el usuario como un asistente inteligente a travs de una decisin basada en los valores de decisiones.
En comparacin con otros BMI formados con una seal de enseanza externa, el primer paso en el diseo Actor-Crtica de S-BMI fue extraer una medida interna de usuario objetivo en forma de retroalimentacin evaluativa desde el cerebro. Hemos investigado la posibilidad de extraer una seal de NACC para la adaptacin de la Actor.
Un aspecto importante de una retroalimentacin evaluativa es que tiene que contener tanto refuerzo positivo y negativo, donde el componente positivo predice recompensar el componente negativo predice aversin. Identificamos que las neuronas bilaterales selectivos mostraron preferencia de objetivos especficos al disminuir su tasa de disparo y cuando el animal se acerc a la meta. Estas neuronas son buenos candidatos para la extraccin de retroalimentacin evaluativa porque podan predecir refuerzo positivo y negativo. Se probo la adaptacin del actor basado en la retroalimentacin evaluativa NACC en dos condiciones, entornos cambiantes y en presencia de la dinmica de estados neuronales en M1. El actor fue capaz de adaptar su poltica de control en entornos cambiantes para resolver tareas nuevas. En todas las simulaciones, se observ que al cambiar el entorno de la Actor adaptado su poltica de control en consecuencia para utilizar las acciones que se requieren para resolver la tarea. Una de las caractersticas atractivas de S-BMI era que si una tarea nueva era dentro del espacio atravesado por una poltica de control aprendidas, el actor fue capaz de realizar la tarea sin necesidad de adaptacin. En otras palabras, el Actor a adaptado su poltica de control slo si no era capaz de cumplir la tarea. En el marco S-BMI el actor se adapta al usuario slo si el rendimiento se degrada sin embargo, la adaptacin de la tasa de aprendizaje basado en una medida de rendimiento es objeto de futuras investigaciones. Adaptacin de la poltica de control de tareas nuevas requeridos utilizando nueva secuencia de acciones, sin embargo, en el caso de cambio de los patrones neuronales, el Actor necesario para encontrar una nueva asignacin entre el estado neural y acciones. Hemos introducido un nuevo patrn neural por revolver la preferencia de accin de las neuronas. Una vez ms, la IA puede asociar al estado neural nuevo a las acciones apropiadas utilizando slo una retroalimentacin evaluativa.
La arquitectura del actor-crtico da flexibilidad y gran adaptacin a los cambios tanto en el medio ambiente y los estados neuronales. En la medida, ya que hay grupos repetidos de estados neuronales que se correlacionan con la tarea, la IA autnoma les asocia a las medidas apropiadas, de tal forma de maximizar los objetivos de usuario. Dado que la IA utiliza la capacidad computacional del cerebro para la prediccin de recompensa / castigo, debemos tener en cuenta el clculo requerido para la estimacin de la retroalimentacin evaluativa de la actividad neural conjunto en el cerebro. Como se puede apreciar el uso de la comunicacin entre el cerebro-maquina puede ser utilizado para otros fines que se pueden ver todos los das en nuestros propios hogares, que pueden ser beneficiosos para los usuarios que no tienen necesariamente una indicacin mdica para usar uno. El software inteligente incorporar informacin sobre el sistema, usuario y entorno ambiental para ayudar a los usuarios a centrarse en los objetivos en lugar de los procesos, la informacin actual ms eficaz, reducir errores, y facilitar la interaccin natural. Las interfaces bien diseadas, con grficos y la consideracin de las preferencias del usuario final y las expectativas, se lograra que las S-BMI futuras sean ms naturales e intuitivas. A diferencia de modelado computacional o tradicional estudio neurobiolgico de estos sistemas, se ha presentado una mtodo que permite una directa y en tiempo real entre el dilogo sistemas biolgicos y computacionales. Un diseo importante de la arquitectura es que ni el usuario ni el CA puede resolver la tarea de forma independiente, por lo tanto, las entidades se convierten por diseo simbiticamente relacionados entre s: el cerebro del usuario no tiene acceso directo al espacio exterior, donde la recompensa se encuentra y los estados CA no se puede actualizar sin neuromodulacin por lo que no puede resolver la evaluacin de recompensas solos. Tanto la necesidad de aprender cmo cooperar simbiticamente y el uso de los requisitos previos de valor basada en la toma de decisiones a resolver la tarea requiere de ambos. Uno de los facilitadores de este proceso es el intercambio de los objetivos, lo que facilita el dilogo cerebro-ordenador y Simbiosis. En comparacin con un anlisis sustituto, la verdadera retroalimentacin evaluativa NACC proporciona un mtodo til para la adaptacin del Actor para resolver una tarea de largo alcance 3-D.

A Symbiotic Brain-Machine Interface Through Value

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

A Symbiotic Brain-Machine Interface Through Value

Загружено:

Авторское право:

Доступные форматы

Inteligencia Artificial

Simulador de bucle cerrado y Descifrando simultaneo utilizando M1 y NACC

a. BMI, Arquitectura del Control

C. Simulador de bucle cerrado Es el primer paso para probar la

d. Descifrado simultneo utilizando M1 y NACC

Se debe cuantificar las propiedades y el rendimiento en las siguientes reas.

a. Propiedades temporal de la actividad NACC

b. Convergencia del actor-crtico durante los cambios ambientales

c. La reorganizacin de la representacin neural

d. Robot de control utilizando simultneamente M1 y NACC

Prerequesites for Symbiotic Brain-Machine Interfaces

Visin para Siguiente Generacin en la interaccin maquina-cerebro

Requisitos para la simbiosis y BMI co-adaptativo.

Brain-Computer Interfaces for Non-Medical Applications: How to Move Forward

Supervisin de estado de usuario

Training and educacin

Вам также может понравиться