Вы находитесь на странице: 1из 6

UNIVERSIDAD NACIONAL DE SAN AGUSTN

FACULTAD DE INGENIERA DE PRODUCCIN Y SERVICIOS


ESCUELA PROFESIONAL DE INGENIERA DESISTEMAS

CURSO:
INTELIGENCIA ARTIFICIAL II

TEMA DE EXPOSICION:
RECONOCIMIENTO DEL HABLA PARA REALIZAR OPERACIONES
MATEMATICAS BASICAS EN DISPOSITIVOS MOVILES

PRESENTADO POR:

TICONA LARICO JOSE ABEL

AREQUIPA- PER
2013

INDICE:
I.

ESTADO DEL ARTE


1. Historia
2. Tcnicas actuales

II.

PLAN DE PROYECTO
1.
2.
3.
4.
5.
6.
7.
8.

Introduccin y Motivacin
Objetivo general
Objetivos especficos
Alcances y Limitaciones
Desarrollo
Cronograma de trabajo
Bibliografa
anexos

RECONOCIMIENTO DEL HABLA PARA REALIZAR


MATEMATICAS BASICAS EN DISPOSITIVOS MOVILES

OPERACIONES

I. Estado Del arte


1. Historia
Los sistemas de reconocimiento del habla datan de los aos 50. Estos
primeros trabajos abordaban el reconocimiento de un vocabulario
reducido, del orden de 10 palabras, emitidas por un nico locutor.
En la dcada de los 70 se hicieron la creacin de sistemas de
reconocimiento de palabras aisladas. En sta dcada, los sistemas de
reconocimiento estaban basados en los mtodos de programacin
dinmica.
Sin embargo, en los 80 se produce un desplazamiento de estos mtodos
en favor de los modelos ocultos de Jrkov (HMM: del ingls Hidden
Markov Models), ampliamente utilizados en la actualidad. Tambin se
comienzan a utilizar algunas aproximaciones basadas en redes
neuronales.
2. Tcnica Actuales
En la actualidad se utilizan mucho los modelos ocultos de Markov o su
versin hbrida con redes neuronales y llegan a un reconocimiento del
orden del 95%, en discurso continuo.
II. Plan De Proyecto
1. Introduccin y Motivacin
La interaccin entre el ser humano y la tecnologa es cada vez ms
comn por estos das. La constante necesidad del hombre por
automatizar las tareas comunes es lo que ha permitido un enorme
desarrollo de las interfaces con mquinas. Es por ello que las interfaces
por voz nos traen muchas ventajas como por ejemplo elimina algunas
limitaciones fsicas, una velocidad mayor al comunicarnos etc.
Hoy en da la mayora de las personas contamos con algn dispositivo
mvil ya sea celular, tablet, etc... Y ms aun no existe ningn dispositivo
mvil que no cuente con alguna aplicacin que nos permite realizar

operaciones matemticas fundamentales (restar, sumar, etc.). Esto se


ha hecho con la finalidad de tener una calculadora disponible en
cualquier lugar o circunstancia en el que se encuentre el usuario.
Los dos aspectos mencionados anteriormente son los que nos motiva al
desarrollo de este proyecto: La incorporacin del reconocimiento del
habla como interfaz para realizar operaciones matemticas en nuestro
dispositivo mvil.
2. Objetivo General
El objetivo principal del presente proyecto es implementar un interfaz de
que permita el reconocimiento e interpretacin de la voz para resolver
operaciones matemticas en dispositivos mviles.
3. Objetivos Especficos
Para llevar a cabo el objetivo principal es necessrio cumplir com los
siguientes objetivos especficos:
o Disear un interfaz que permita la captura y procesamiento de la voz.
o Crear un sistema Hibrido que nos permita obtener el reconocimiento
y representacin se la seal de voz.
o Crear una gramtica que nos permita reducir el vocabulario del
usuario y solo reconocer las establecidas para nuestra interfaz de
voz.
4. Alcances y Limitaciones
Nuestro sistema ser exclusivamente para dispositivos mviles que
soporten plataforma android, donde el reconocimiento de la voz se dar
en tiempo real.
Solo se permitir el reconocimiento de la voz en el idioma castellano.
El Sistema deber ser ejecutado en lugares adecuados donde no exista
la interferencia del ruido.
Solo podr reconocer nmeros y operadores matemticos esto con el fin
de garantizar el buen funcionamiento de nuestro.

5. Desarrollo
En la mayora de las investigaciones para el reconocimiento del habla
nos dicen que existen etapas bien definidas. Nosotros para la
construccin de este proyecto hemos considerado dos etapas
principales:
1. Captura y Procesamiento del habla
Es aqu donde se realiza un anlisis de la seal anloga de la voz
para procesarla y convertirla en una seal digital. Adems el objetivo
de esta tapa es acondicionar la seal de entrada para que esta
pueda ser procesada por nuestra red. En esta etapa tambin se usa
para reduccin del ruido.
Describimos las
procesamiento.

tcnicas

que

usaremos

en

la

etapa

de

1.1 Extraccin de las caracterizas fundamentales


Usaremos las transformadas de wavelet esto nos permitir a
extraer las caractersticas principales que describan representen
bien a la seal. Tambin nos ayuda a reducir el efecto del ruido
en la seal
1.2 Segmentacin
Consiste en dividir una emisin en diferentes trozos de acuerdo
algn criterio. Para realizar esto usaremos tcnicas de algoritmos
genticos para poder encontrar la posicin indicada para
segmentar la seal.
1.3 Normalizacin
La normalizacin consiste en ajustar todos los parmetros a una
sola escala para que al momento de ser utilizados por la RNA no
causen problemas de estabilidad
2. Etapa de clasificacin y entrenamiento
2.1 Clasificacin
El objetivo de esta etapa es obtener una representacin de la
seal de voz como una cadena de smbolos asociados. Para ello
usaremos una red neuronal (NN).
2.2 Entrenamiento
Para realizar el entrenamiento de los pesos de nuestra red
neuronal como alternativa al backpropagation usaremos
algoritmos genticos.
6. Arquitectura

7. Cronograma de trabajo
Actividad

Duracin

Diseo de la arquitectura del sistema

1 semana

Desarrollo del interfaz para la captura de voz

2 semanas

Implementacin del Sistema Hibrido para el


reconocimiento de la voz

4 semanas

Revisiones y pruebas del funcionamiento del


sistema

1 semana

8. Bibliografa
[1] Algoritmos y Metodos para el Reconocimiento de Voz en Espaol
Mediante Silabas Jose Luis Oropeza Rodriguez Centro de
investigacin en Computacion-IPN
[2] Desarrollo de un sistema de reconocimiento automtico del hablaMarcos Calvo Lance- Universidad politcnica de Valencia
[3] Advances in Speech Recognition- Janeza Trdine 9, 51000 Rijeka,
Croatia- 2010
[4] Speech Recognition using Neural Networks - Joe Tebelskis - May
1995 -CMU-CS-95-142
9. Anexos
o Paper de referencia

Вам также может понравиться