Академический Документы
Профессиональный Документы
Культура Документы
TEZIUTLÁN
TEMA:
PRESENTA:
MATERIA:
FUNDAMENTOS DE INVESTIGACIÓN
CARRERA:
ING. SISTEMAS
GRADO Y GRUPO:
2° “B”
AULA: 3
ÍNDICE
1. Introducción……………………………………………………………….(2)
2. Planteamiento…………………………………………………………….(3)
3. Justificación……………………………………………………………….(3)
4. Objetivos…………………………………………………………………..(3)
5. Definición de I.A.…………………………………………………………(4)
6. El nacimiento de I.A……………………………………………………..(5)
7. El regreso de las redes neuronales …………………………………...(5)
8. I.A. se convierte en ciencia. …………………………………………….(6)
9. Memoria y aprendizaje…………………………………………………..(7)
9.1. Memoria y aprendizaje desde un punto de vista fisiológico……(9)
9.2. La memoria del hombre…………………………………………….(10)
9.3. La física estadística y el cerebro………………......................... (12)
10. Redes neuronales……………………………………………………. (13)
10.1. Definición de neurona…………………………. …..........(13)
10.2. Unidades en redes neuronales…………………………….(15)
10.3. Estructuras de las redes…………………………………….(17)
10.4. Redes neuronales de una sola capa………………….......(19)
10.5. Redes neuronales multicapa……………………………….(22)
10.6. Aprendizaje de la estructura de las redes neuronales.....(24)
11. Computadoras neuronales…………………………............................(25)
12. Aplicaciones de las redes neuronales………………………………....(29)
12.1. Bibliometría……………………………………………...........(29)
12.2. Análisis de datos………………………………………… (35)
12.3. Psicología………………………………………………….... (43)
12.4. Video juegos…………………………………………………..(45)
13. Conclusión……………………………………………………………......(50)
14. Bibliografía /referencias………………………………………………....(51)
1. INTRODUCCIÓN
2. PLANTEAMIENTO
3. JUSTIFICACIÓN
4. OBJETIVOS
MARCO TEÓRICO
Warren McCulloch y Walter Pitts (1943) son los autores reconocidos del
primer trabajo enfocado a la I.A. Estos personajes, partieron de tres
áreas: conocimientos sobre la fisiología básica y funcionamiento de las
neuronas en el cerebro, el análisis formal de la lógica proposicional de
Russell y Whitehead y la teoría de computación de Turing. Propusieron un
modelo constituido por neuronas artificiales, en el que cada una de ellas
se caracterizaba por estar activada o desactivada; la activación se daba
como la respuesta de estimulación producida por una cantidad suficiente
de neuronas vecinas.
La mayor parte del trabajo realizado con redes neuronales se realizó con
la idea de dejar a un lado lo que se podía hacer y de descubrir en que se
Desde hace algunos años, ha habido intentos por hacer modelos físicos
muy simples para describir algunos aspectos del cerebro. Estos modelos
se basan en el hecho de que el cerebro tiene un gran número de
neuronas, del orden de 1010 a 1011,22 y en que no es relevante la
contribución individual especifica de cada una de ellas. Por lo anterior, es
razonable suponer que debe haber un mecanismo colectivo involucrado
en las funciones que señalamos anteriormente; de ser así, parece
adecuado hacer un tratamiento probabilístico de la actividad neuronal.
α i=g´ (¿i )
α 0=1
W 0 , i=1
∫ g
∑¿i
αi
W j ,i
aj
n
¿i =∑ W j ,i a j
j=0
a i=g ( ¿i )=g ¿)
ANDw 0=1.5,
w 1=1., w 2=1,
OR w 0=0.5 , w 1=1
w 2=1
Las unidades con una función de activación umbral pueden actuar como
puertas lógicas, con entradas y peso de sesgo apropiados.
Las redes con alimentación hacia delante representan una función de sus
entradas actuales; de este modo no tiene otro estado interno que no sea
de sus propios pesos. Por otro lado, las redes recurrentes dejan que sus
salidas alimentes sus propias entradas. Esto significa que los niveles de
activación de una red forman un sistema dinámico que debe de alcanzar
un estado estable, exhibir oscilaciones o incluso un comportamiento
caótico. Además, la respuesta de la red dada unas entradas depende de
su estado inicial, que dependerá de entradas previas. Por lo tanto las
redes recurrentes (a diferencia de las redes con alimentación hacia
delante) pueden tener memoria a corto plazo. Esto las hace mas
interesantes como modelos del cerebro, pero también mas difíciles de
entender.
Ahora bien, si la afirmación que dice que una red con alimentación hacia
delante representa una función de sus entradas. (Figura) consideremos
una red que tiene dos unidades de entrada, dos unidades ocultas y una
unidad de salida. Dado un vector de entrada x= ( x 1 , x 2), las activaciones
de las unidades de entrada se ponen a (a 1 , a2=x 1 , x 2 y la red calcula esto:
Red neuronal con dos entradas, una capa oculta de dos unidades y una sencilla
Lo que esta función nos quiere decir, es que expresa la salida de cada
unidad oculta como una función de sus entradas, hemos mostrado la
salida de la red como una suma, a 5, en función de sus entradas de la red.
Además, observamos que los pasos de la red actúan como parámetros
de la función; escribiendo W para los parámetro, la red. Esta es la manera
en que se produce el aprendizaje en las redes neuronales.
Una red neuronal se puede usar para clasificación o para regresión. Para
clasificaciones booleanas con entradas continuas, es tradicional tener una
única unidad de salida, con un valor por encima de 0.5 interpretando
como una clase y como un valor por debajo de 0.5 como otra. Para la
clasificación en k-clases, se pude dividir el rango de la unidad de salida en
k partes, pero es más común tener k unidades de salida separadas,
donde el valor de cada una representa la verosimilitud relativa de esta
clase dada una entrada actual.
Una red con todas las entradas conectadas directamente a las salidas se
denominan red neuronal de una sola capa o red perceptrón. Ya que
cada unidad de salida es independiente de las otras (cada peso afecta
una sola de las salidas) para hacer una explicación más simple
hablaremos de perceptrones con una unidad de salida (figura).
∑ W j x j >0 o W ⋅ x >0
j=0
1 1
E= Er r 2 ≡ ¿
2 2
entrada: ejemplos, un cojunto de ejemplos, cada uno con entrada x= x 1 , … , x n y salida y red,
un perceptrón con pesos W j , j=0… n, y función de activación g
repetir
in← ¿
Err← y [ e ] −g ( ¿ )
W j ← W j+ α × Err × g´ (¿)× x j [e ]
El algoritmo de aprendizaje del descenso del gradiente para perceptrones, asumiendo una función de
activación g
Supongamos que queremos construir una red con una capa oculta de 10
entradas, la figura muestra la red.
entrada: ejemplos, un conjunto de ejemplos, cada uno con vector de entrada x y un vector de
salida y red, una red multicapa con L capas, pesos W j ,i función de activación g
repetir
¿i ⟵ ∑ j W j ,i a j
ai ⟵ g ( ¿i )
△ i ⟵ g´ ( ¿i ) ⋉( y i [e ]−a i)
△ i ⟵ g´ ( ¿ j ) ∑i W j , i △ i
W j ,i ⟵W j ,i + α ⋉ α j ⋉ △ i
Devolver HIPOTESIS-RED-NEURONA(red)
El algoritmo de propagación hacia atrás para aprendizaje de redes multicapa
Se han propuesto varios algoritmos para conseguir una red más grande,
aumentando una red más pequeña. Uno de estos algoritmos es el
algoritmo de Tiling, se parece al aprendizaje de listas de decisión. La idea
¿Que nos deparara el futuro? Los países capitalistas han llevado a cabo
bajo las presiones de intereses políticos y económicos, principalmente.
Dentro de este contexto, la creación de maquinas “pensantes” es de
primordial importancia, debido a su potencialidad de comercialización y a
su uso con objetivos militares. Podríamos decir que su rango de
aplicaciones seria prácticamente ilimitado.
Bajo toda esta presión, las redes neuronales tendrán un gran impulso en
los años que se avecinan, y que esto repercutirá, aun más, en todos los
aspectos de nuestra vida. Estas computadoras no sustituirán a las
computadoras convencionales, sino que las complementarán. De manera
que podremos contar con computadoras hibridas, que utilicen uno u otro
tipo de computación, dependiendo del problema, o de la parte del
problema a resolver. Pero ¿Qué tan lejos nos encontramos de construir
maquinas tan poderosas como el cerebro humano?
a. BIBLIOMETRÍA
• La selección de variables,
• Regresión,
• Cambios y desviaciones,
B. ANÁLISIS DE DATOS
Uno de los aspectos que han fomentado la idea errónea acerca de las
diferencias entre RNA y estadística versa sobre la terminología utilizada
en la literatura de ambos campos. Recordemos que el campo de las RNA
surge como una rama de la IA con una fuerte inspiración neurobiológica y
su desarrollo ha sido debido a la contribución de investigadores
procedentes de una gran variedad de disciplinas. A continuación, se
Y ≅ f (X , W )
Utilizando esta función de error conseguimos que las salidas puedan ser
interpretadas como probabilidades a posteriori (Bishop, 1994). Sin
embargo, en general la obtención de los parámetros de una red se realiza
Una red MLP compuesta por tres capas cuya capa oculta de neuronas
utiliza una función de activación no lineal –en general, la función
logística--, puede ser vista como una generalización no lineal de los MLG
(Biganzoli, Boracchi, Mariani y Marubini, 1998).
La principal virtud de una red MLP que permite explicar su amplio uso en
el campo del análisis de datos es que se trata de un aproximador
universal de funciones. La base matemática de esta afirmación se debe a
Kolmogorov (1957), quien constató que una función continua de
diferentes variables puede ser representada por la concatenación de
varias funciones continuas de una misma variable. Esto significa que un
Perceptrón conteniendo al menos una capa oculta con suficientes
unidades no lineales, tiene la capacidad de aprender virtualmente
cualquier tipo de relación siempre que pueda ser aproximada en términos
de una función continua (Cybenko, 1989; Funahashi, 1989; Hornik,
Stinchcombe y White, 1989). También se ha demostrado que utilizando
más de una capa oculta, la red puede aproximar relaciones que impliquen
funciones discontinuas (Rzempoluck, 1998). Si no se utilizan funciones de
activación no lineales en la/s capa/s oculta/s, la red queda limitada a
actuar como discriminador/aproximador lineal.
Por último, hemos comentado que las RNA estiman los pesos en base a
algún criterio de optimización sin tener en cuenta supuestos como el tipo
de distribución o la dependencia funcional entre las variables. Por este
motivo, las RNA han sido consideradas por muchos autores como
modelos no paramétricos (Smith, 1993). Sin embargo, autores de
reconocido prestigio como Bishop (1995) sostienen que las RNA y los
modelos estadísticos asumen exactamente los mismos supuestos en
cuanto al tipo de distribución; lo que sucede es que los estadísticos
estudian las consecuencias del incumplimiento de tales supuestos,
mientras que los investigadores de RNA simplemente las ignoran. En este
sentido, hemos visto el paralelismo que se establece entre los criterios de
minimización utilizados por las RNA y el método de máxima-verosimilitud,
bajo el cumplimiento de ciertos supuestos. Otros autores como Masters
(1993) son más flexibles y sostienen que supuestos como normalidad,
homogeneidad de variancias y aditividad en las variables de entrada son
características recomendables para una red neuronal aunque no son
estrictamente necesarias como sucede en los modelos estadísticos.
Una red MLP con funciones de activación logísticas en las salidas puede
ser utilizada como una Función Discriminante no lineal (Biganzoli,
Boracchi, Mariani y Marubini, 1998) (ver figura 9).
C. PSICOLOGÍA
Screaming Racers
la industria de los video juegos de hoy están fuerte como los ingresos de
la industria fílmica. Lo juegos de computadora son distribuidos a través
de todo el mundo y son vendidos a millones de personas. De varios tipos
diferentes de juegos, el mas popular es el “car racing”. Los
desarrolladores de este tipo de juego son cada vez más provistos de
sistemas de inteligencia artificial, así que sus controladores virtuales
pueden exhibir los comportamientos humanos. En este articulo les
mostramos como estos controladores virtuales pueden ser usados con
Con este escenario muchos juegos genres han sido desarrollados desde
la llegada de los primeros video juegos. Uno de los tipos mas populares
es el “Racing Genre” que ha crecido notoriamente en años recientes. En
este tipo de juego el jugador usualmente adopta la posición del conductor
y es responsable de conducir tan rápido como el quiera en la carretera.
Así, que la forma mas fácil de tener un auto controlado por IA, que este
conduzca a través de la carretera, este define las líneas del inicio a las del
fin de cada sector para guiar el carro. Haciendo esto podemos marcar el
camino optimo para cada carretera y la I A simplemente seguirá la líneas.
Podemos incluso agregar información extra para cada sector tal cual es el
tipo de terreno.
CONCLUSIÓN
A las conclusiones que se llegaron fueron las siguientes:
BIBLIOGRAFÍA / REFERENCIAS