Inteligencia Artificial

UNIVERSIDAD NACIONAL DE SAN AGUSTN
FACULTAD DE INGENIERA DE PRODUCCIN Y SERVICIOS

ESCUELA PROFESIONAL DE INGENIERA DESISTEMAS
CURSO:
INTELIGENCIA ARTIFICIAL II
TEMA DE EXPOSICION:
RECONOCIMIENTO DEL HABLA PARA REALIZAR OPERACIONES
MATEMATICAS BASICAS EN DISPOSITIVOS MOVILES
PRESENTADO POR:
TICONA LARICO JOSE ABEL
AREQUIPA- PER
2013
INDICE:
I.
ESTADO DEL ARTE

1. Historia
2. Tcnicas actuales
II.
PLAN DE PROYECTO
1.
2.
3.
4.
5.
6.
7.
8.
Introduccin y Motivacin
Objetivo general
Objetivos especficos
Alcances y Limitaciones
Desarrollo
Cronograma de trabajo
Bibliografa
anexos
RECONOCIMIENTO DEL HABLA PARA REALIZAR

MATEMATICAS BASICAS EN DISPOSITIVOS MOVILES
OPERACIONES
I. Estado Del arte

1. Historia
Los sistemas de reconocimiento del habla datan de los aos 50. Estos
primeros trabajos abordaban el reconocimiento de un vocabulario
reducido, del orden de 10 palabras, emitidas por un nico locutor.
En la dcada de los 70 se hicieron la creacin de sistemas de
reconocimiento de palabras aisladas. En sta dcada, los sistemas de
reconocimiento estaban basados en los mtodos de programacin
dinmica.
Sin embargo, en los 80 se produce un desplazamiento de estos mtodos
en favor de los modelos ocultos de Jrkov (HMM: del ingls Hidden
Markov Models), ampliamente utilizados en la actualidad. Tambin se
comienzan a utilizar algunas aproximaciones basadas en redes
neuronales.
2. Tcnica Actuales
En la actualidad se utilizan mucho los modelos ocultos de Markov o su
versin hbrida con redes neuronales y llegan a un reconocimiento del
orden del 95%, en discurso continuo.
II. Plan De Proyecto
1. Introduccin y Motivacin
La interaccin entre el ser humano y la tecnologa es cada vez ms
comn por estos das. La constante necesidad del hombre por
automatizar las tareas comunes es lo que ha permitido un enorme
desarrollo de las interfaces con mquinas. Es por ello que las interfaces
por voz nos traen muchas ventajas como por ejemplo elimina algunas
limitaciones fsicas, una velocidad mayor al comunicarnos etc.
Hoy en da la mayora de las personas contamos con algn dispositivo
mvil ya sea celular, tablet, etc... Y ms aun no existe ningn dispositivo
mvil que no cuente con alguna aplicacin que nos permite realizar
operaciones matemticas fundamentales (restar, sumar, etc.). Esto se

ha hecho con la finalidad de tener una calculadora disponible en
cualquier lugar o circunstancia en el que se encuentre el usuario.
Los dos aspectos mencionados anteriormente son los que nos motiva al
desarrollo de este proyecto: La incorporacin del reconocimiento del
habla como interfaz para realizar operaciones matemticas en nuestro
dispositivo mvil.
2. Objetivo General
El objetivo principal del presente proyecto es implementar un interfaz de
que permita el reconocimiento e interpretacin de la voz para resolver
operaciones matemticas en dispositivos mviles.
3. Objetivos Especficos
Para llevar a cabo el objetivo principal es necessrio cumplir com los
siguientes objetivos especficos:
o Disear un interfaz que permita la captura y procesamiento de la voz.
o Crear un sistema Hibrido que nos permita obtener el reconocimiento
y representacin se la seal de voz.
o Crear una gramtica que nos permita reducir el vocabulario del
usuario y solo reconocer las establecidas para nuestra interfaz de
voz.
4. Alcances y Limitaciones
Nuestro sistema ser exclusivamente para dispositivos mviles que
soporten plataforma android, donde el reconocimiento de la voz se dar
en tiempo real.
Solo se permitir el reconocimiento de la voz en el idioma castellano.
El Sistema deber ser ejecutado en lugares adecuados donde no exista
la interferencia del ruido.
Solo podr reconocer nmeros y operadores matemticos esto con el fin
de garantizar el buen funcionamiento de nuestro.
5. Desarrollo
En la mayora de las investigaciones para el reconocimiento del habla
nos dicen que existen etapas bien definidas. Nosotros para la
construccin de este proyecto hemos considerado dos etapas
principales:
1. Captura y Procesamiento del habla
Es aqu donde se realiza un anlisis de la seal anloga de la voz
para procesarla y convertirla en una seal digital. Adems el objetivo
de esta tapa es acondicionar la seal de entrada para que esta
pueda ser procesada por nuestra red. En esta etapa tambin se usa
para reduccin del ruido.
Describimos las
procesamiento.
tcnicas
que
usaremos
en
la
etapa
de
1.1 Extraccin de las caracterizas fundamentales

Usaremos las transformadas de wavelet esto nos permitir a
extraer las caractersticas principales que describan representen
bien a la seal. Tambin nos ayuda a reducir el efecto del ruido
en la seal
1.2 Segmentacin
Consiste en dividir una emisin en diferentes trozos de acuerdo
algn criterio. Para realizar esto usaremos tcnicas de algoritmos
genticos para poder encontrar la posicin indicada para
segmentar la seal.
1.3 Normalizacin
La normalizacin consiste en ajustar todos los parmetros a una
sola escala para que al momento de ser utilizados por la RNA no
causen problemas de estabilidad
2. Etapa de clasificacin y entrenamiento
2.1 Clasificacin
El objetivo de esta etapa es obtener una representacin de la
seal de voz como una cadena de smbolos asociados. Para ello
usaremos una red neuronal (NN).
2.2 Entrenamiento
Para realizar el entrenamiento de los pesos de nuestra red
neuronal como alternativa al backpropagation usaremos
algoritmos genticos.
6. Arquitectura
7. Cronograma de trabajo
Actividad
Duracin
Diseo de la arquitectura del sistema
1 semana
Desarrollo del interfaz para la captura de voz
2 semanas
Implementacin del Sistema Hibrido para el

reconocimiento de la voz
4 semanas
Revisiones y pruebas del funcionamiento del

sistema
1 semana
8. Bibliografa
[1] Algoritmos y Metodos para el Reconocimiento de Voz en Espaol
Mediante Silabas Jose Luis Oropeza Rodriguez Centro de
investigacin en Computacion-IPN
[2] Desarrollo de un sistema de reconocimiento automtico del hablaMarcos Calvo Lance- Universidad politcnica de Valencia
[3] Advances in Speech Recognition- Janeza Trdine 9, 51000 Rijeka,
Croatia- 2010
[4] Speech Recognition using Neural Networks - Joe Tebelskis - May
1995 -CMU-CS-95-142
9. Anexos
o Paper de referencia

Inteligencia Artificial

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Inteligencia Artificial

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDAD NACIONAL DE SAN AGUSTN

FACULTAD DE INGENIERA DE PRODUCCIN Y SERVICIOS

TICONA LARICO JOSE ABEL

ESTADO DEL ARTE

RECONOCIMIENTO DEL HABLA PARA REALIZAR

I. Estado Del arte

operaciones matemticas fundamentales (restar, sumar, etc.). Esto se

1.1 Extraccin de las caracterizas fundamentales

Diseo de la arquitectura del sistema

Desarrollo del interfaz para la captura de voz

Implementacin del Sistema Hibrido para el

Revisiones y pruebas del funcionamiento del

Вам также может понравиться