Reconocimiento Óptico de Caracteres (Ocr) Con Redes Neuronales

RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR) CON REDES NEURONALES
ESTADO DEL ARTE

OPTICAL CHARACTER RECOGNITION (OCR) WITH NEURAL NETWORKS
STATE OF THE ART
Juan Pablo Ordóñez L.

Loja
086244139
jpordonez@utpl.edu.ec
RESUMEN conversion of written text on paper to text

Los sistemas que, a partir de un texto stored in an ASCII file.
escrito o impreso en papel o similar, WORKS KEY: Ocr, network neuronal,
crean un fichero de texto en un soporte de Recognition of manuscripts.
almacenamiento informático, se
denominan Sistemas de OCR (Optical
Character Recognition), o de HISTORIA DE OCR
Reconocimiento óptico de Caracteres. Un
sistema OCR cuenta con las siguientes
características: de poder "aprender", En 1929, Gustav Tauschek obtuvo una
mediante una red neuronal, patrones de patente sobre OCR en Alemania, luego,
caracteres que representen las posibles Handel en 1933 obtiene la patente de
variaciones (tamaño) de la forma de los
diferentes caracteres impresos que pueden OCR en EEUU. En 1935, a Tauschek
aparecer en los documentos, para en el también se le concedió una patente en
futuro y con la misma red, poder EEUU por su método.
"reconocerlos" y realizar la conversión
del texto escrito en papel a texto La máquina de Tauschek era un
almacenado en un fichero ASCII. dispositivo mecánico que utilizaba
PALABRAS CLAVE: Ocr, Redes plantillas. Un foto-detector era colocado
neuronales, Reconocimiento de de modo que cuando la plantilla y el
manuscritos. carácter que se reconocería estuvieran
ABSTRACT alineados, una luz era dirigida hacia ellos.
Systems that, from a written or printed on
paper or similar, creating a text file on a En 1950, David Shepard, criptoanalista en
storage medium for computer systems are
la agencia de seguridad de las fuerzas
called OCR (Optical Character
Recognition). An OCR system has the armadas de los Estados Unidos, fue
following characteristics: can "learn" consultado por Rowlett Franco para
through a neural network, patterns of trabajar con el Dr. Louis Tordella, para
characters representing the possible recomendar los procedimientos de la
variations (size) as the different automatización de los datos de la agencia.
characters that can appear in documents, Esto incluía el problema de convertir
so in the future and with the same
mensajes impresos en lenguajes para
network, able to "recognize" and the
almacenarlos en un computador. Shepard
decide que es posible construir una máquina. IBM y otras empresas fueron
máquina para realizar ese proceso, y, con licenciadas más adelante sobre las
la ayuda del cocinero de Harvey, un patentes del OCR de Shepard.
amigo, construyeron Gismo durante las
tardes y fines de semana. Este suceso fue El servicio postal de Estados Unidos ha
divulgado en los periódicos Washington estado utilizando las máquinas de OCR
Daily News y el New York Times en el para clasificar el correo desde que 1965,
año 1953, después de que su patente fuera basados en la tecnología ideada sobre
concedida. En este momento, Shepard todo por el inventor prolífico Jacob
fundó Intelligent Machines Research Rabinow. El primer uso del OCR en
Corporation (IMR), comenzando a Europa sucedió en la oficina de Gran
fabricar el primero de varios sistemas del Bretaña. En 1965 se comenzó a planear
OCR usados para operaciones un sistema de actividades bancarias
comerciales. Mientras que Gismo y los completo, Nacional Giro, usando la
últimos sistemas de IMR, utilizaron tecnología del OCR, ideó un proceso que
análisis de imagen, en comparación con el revolucionó los sistemas del pago de
carácter que emparejaba, pudiendo cuentas en el Reino Unido. El correo
aceptar una cierta variación de la fuente. postal de Canadá ha estado utilizando
Gismo estaba limitado a los registros sistemas OCR desde 1971. Los sistemas
verticales, mientras que los reconocedores OCR leen el nombre y la dirección del
posteriores de la compañía IMR, destinatario, e imprimen un código de
analizaban caracteres en cualquier parte barras en el sobre basados en el código
del campo de exploración, una necesidad postal del mismo. Después, las cartas
práctica en documentos del mundo real. necesitan solamente ser clasificadas por
los compaginadores, menos costosos que
necesitan leer solamente el código de
El primer sistema comercial fue instalado barras. Para evitar interferencia con el
en Readers Digest en 1955, que, muchos campo de dirección escrita a mano, que se
años más tarde, fue donado por al museo puede situar en cualquier parte de la carta,
Smithsonian, donde fue puesto en la se usa una tinta especial leída bajo una
exhibición. El segundo sistema fue ultravioleta. Esta tinta parece anaranjada
vendido a los Standard Oil Company de en condiciones normales de la
California para leer impresiones en iluminación. Los sobres marcados con el
tarjetas de crédito para propósitos de código de barras que son leídos por la
facturación, además se vendieron muchos máquina pueden ser posteriormente
más sistemas a compañías petroleras. procesados. [1]
Otros sistemas vendieron por el IMR
durante los últimos años 50 incluyeron un ESTADO ACTUAL DE LA
escáner de páginas para la fuerza aérea de
TECNOLOGÍA OCR
los Estados Unidos para la lectura y
transmisión de mensajes escritos a
El reconocimiento exacto de la escritura el Reconocimiento Inteligente de
latina, ahora se considera en gran parte un Caracteres.
problema solucionado. La exactitud
excede el 99%, aunque hay veces en que El reconocimiento del texto cursivo es un
se exige incluso una exactitud más alta, campo de investigación activo, con
requiriendo la revisión humana para los medidas de reconocimiento incluso mas
errores. Actualmente está en desarrollo el baja que el del reconocimiento de texto
reconocimiento de la mano que escribe, al impreso a mano. Índices más altos del
igual que el reconocimiento del texto reconocimiento de la escritura cursiva
impreso en otras lenguas (especialmente general no serán probablemente posibles
en los que tienen un número muy grande sin el uso de la información del contexto
de caracteres). o gramatical. Por ejemplo, el
reconocimiento de palabras enteras de un
Los sistemas reconocedores el texto diccionario es más fácil que intentando
impreso a mano han gozado de éxito analizar caracteres individuales de la
comercial estos últimos años. Entre éstos escritura. La lectura de la línea de la
están dispositivos de asistencia personales monto de un cheque, es un ejemplo donde
digitales (PDA) tales como los Palm OS. usar un diccionario más pequeño
Apple es pionero en esta tecnología. Los especializado en escritura de números,
algoritmos usados en estos dispositivos puede aumentar tarifas del
toman ventaja del orden, velocidad y reconocimiento enormemente. El
dirección de las líneas o segmentos conocimiento de la gramática de la lengua
individuales en su entrada son conocidos. que es explorada puede también ayudar a
También, el usuario puede aprendido determinar si una palabra es probable ser
habilidades nuevas para utilizar un verbo o un sustantivo, por ejemplo,
solamente formas específicas de la letra permitiendo mayor exactitud.
(por ejemplo, un triangulo sin su base
correspondería a la letra A). Estos Para problemas más complejos del
métodos no se pueden utilizar en software reconocimiento, se usan los sistemas de
escanean documentos en papel, por lo que reconocimiento inteligente de caracteres,
el reconocimiento exacto de documentos pues las redes neuronales artificiales que
impresos a mano sigue siendo en gran los componen, trabajan indiferentes a las
parte un problema abierto al desarrollo. transformaciones lineales y no lineales
Índices de exactitud del 80 al 90% en del proceso de reconocimiento.
caracteres impresos a mano, pueden ser
alcanzados, pero esta exactitud todavía se Una variante del OCR es el OMR (optical
traduce en docenas de errores por cada mark recognition) que se utiliza para
página, haciendo la tecnología útil reconocimiento de marcas. Una
solamente en contextos muy limitados. aplicación sería la corrección automática
Esta variedad de OCR ahora se conoce de exámenes de tipo test, en los que la
comúnmente en la industria como ICR, o respuesta correcta se rodea con un
círculo, tipo PSU. [2] [3]
Software OCR.
Aquí se lista algunas aplicaciones que hacen uso de la
tecnología ocr. [4]
Nombre Licencia Sistemas Notas
Operativos
ExperVision Commercial Windows,Mac OS ExperVision Inc. was founded
TypeReader & X,Unix,Linux,OS/2 in 1987, its OCR technology
OpenRTK and product won the highest
marks in the independent
testing performed by UNLV
for the consecutive years that
ExperVision participated.
ABBYY Commercial Windows For working with localized
FineReader OCR interfaces, corresponding
language support is required.
OmniPage Commercial Windows, Mac OS Product of Nuance
(Nuance Communications
EULA)
Readiris Commercial Windows, Mac OS Product of I.R.I.S. Group of
Belgium. Asian and Middle
Eastern editions.
SmartZone Commercial Windows Zonal OCR is the process by
(formerly known which Optical Character
as Zonal OCR) Recognition (OCR)
applications "read"
specifically zoned text from a
scanned image.
Computhink's Commercial Windows Document Management
ViewWise system
CuneiForm BSD variant Windows, Linux, Enterprise-class system, multi
BSD, MacOSX. language, can save text
formatting and recognizes
complicated tables of any
structure
GOCR GPL Many (open source) Early development
Microsoft Office Commercial Windows, Mac OS
Document X
Imaging
Microsoft Office Commercial Windows
OneNote 2007
NovoDynamics Commercial? ? Specializes in languages of the
VERUS Middle East
Ocrad GPL Unix-like, OS/2
Brainware Commercial Windows Template-free data extraction
and processing of data from
documents into any backend
system; sample document
types include invoices,
remittance statements, bills of
lading and POs
HOCR GPL Linux Hebrew OCR
OCRopus Apache Linux Pluggable framework which
can use Tesseract
ReadSoft Commercial Windows Scan, capture and classify
business documents such
forms, invoices and POs.
Alt-N Commercial Windows Multi-language OCR Plug-in
Technologies' is used to convert faxed pages
RelayFax into editable document
Network Fax formats (doc, pdf, etc...) in
Manager many different languages.
Scantron Commercial Windows For working with localized
Cognition interfaces, corresponding
language support is required.
SimpleOCR Freeware and Windows
commercial
versions
SmartScore Commercial Windows, Mac OS For musical scores
Tesseract Apache Windows, Mac OS Under development by Google
X, Linux, OS/2
Software OCR y los lenguajes que soporta. [4]

Nombre Ultima Año de Lenguajes de Diccionarios
versión liberación reconocimiento
ExperVision 7.0 English, French, German,

TypeReader & Italian, Spanish, Portuguese,
OpenRTK Danish, Dutch, Swedish,
Norwegian, Hungarian,
Polish, Finnish and
Polynesian
ABBYY 9.0 2007 Abkhaz, Adyghian, Armenian (Eastern,
FineReader Afrikaans, Agul, Albanian, Western, Grabar),
OCR Altai, Armenian (Eastern, Bashkir, Bulgarian,
Western, Grabar), Avar, Catalan, Croatian,
Aymara, Azerbaijani Czech, Danish, Dutch
(Cyrillic), Azerbaijani (Netherlands and
(Latin), Bashkir, Basic, Belgium), English,
Basque, Belarusian, Bemba, Estonian, Finnish,
Blackfoot, Breton, Bugotu, French, German (new
Bulgarian, Buryat, C/C++, and old spelling),
COBOL, Catalan, Cebuano, Greek, Hebrew,
Chamorro, Chechen, Hungarian, Italian,
Chinese Simplified, Chinese Latvian, Lithuanian,
Traditional, Chukchee, Norwegian (nynorsk
Chuvash, Corsican, Crimean and bokmal), Polish,
Tatar, Croatian, Crow, Portuguese (Portugal
Czech, Dakota, Danish, and Brazil),
Dargwa, Dungan, Dutch Romanian, Russian,
(Netherlands and Belgium), Slovak, Slovenian,
English, Eskimo (Cyrillic), Spanish, Swedish,
Eskimo (Latin), Esperanto, Tatar, Thai, Turkish,
Estonian, Even, Evenki, Ukrainian
Faroese, Fijian, Finnish,
Fortran, French, Frisian,
Friulian, Gagauz, Galician,
Ganda, German
(Luxemburg), German (new
and old spelling), Greek,
Guarani, Hani, Hausa,
Hawaiian, Hebrew,
Hungarian, Icelandic, Ido,
Indonesian, Ingush,
Interlingua, Irish, Italian,
JAVA, Japanese, Jingpo,
Kabardian, Kalmyk,
Karachay-balkar,
Karakalpak, Kasub, Kawa,
Kazakh, Khakass, Khanty,
Kikuyu, Kirghiz, Kongo,
Koryak, Kpelle, Kumyk,
Kurdish, Lak, Latin,
Latvian, Lezgi, Lithuanian,
Luba, Macedonian,
Malagasy, Malay, Malinke,
Maltese, Mansy, Maori,
Mari, Maya, Miao,
Minangkabau, Mohawk,
Moldavian, Mongol,
Mordvin, Nahuatl, Nenets,
Nivkh, Nogay, Norwegian
(nynorsk and bokmal),
Nyanja, Occidental,
Ojibway, Ossetian,
Papiamento, Pascal, Polish,
Portuguese (Portugal and
Brazil), Provencal, Quechua,
Rhaeto-romanic, Romanian,
Romany, Rundi, Russian,
Russian (old spelling),
Rwanda, Sami (Lappish),
Samoan, Scottish Gaelic,
Selkup, Serbian (Cyrillic),
Serbian (Latin), Shona,
Simple chemical formulas,
Slovak, Slovenian, Somali,
Sorbian, Sotho, Spanish,
Sunda, Swahili, Swazi,
Swedish, Tabasaran,
Tagalog, Tahitian, Tajik,
Tatar, Thai, Tok Pisin,
Tongan, Tswana, Tun,
Turkish, Turkmen,
Tuvinian, Udmurt, Uighur
(Cyrillic), Uighur (Latin),
Ukrainian, Uzbek (Cyrillic),
Uzbek (Latin), Welsh,
Wolof, Xhosa, Yakut,
Zapotec, Zulu
OmniPage 16 2007 Afrikaans, Albanian,
Aymara, Basque, Bemba,
Blackfoot, Breton, Bugotu,
Bulgarian, Byelorussian,
Catalan, Chamorro,
Chechen, Corsican,
Croatian, Crow, Czech,
Danish, Dutch, English,
Esperanto, Estonian,
French, Frisian, Friulian,
Gaelic (Irish), Gaelic
(Scottish), Galician,
Ganda/Luganda, German,
Greek, Guarani, Hani,
Hawaiian, Hungarian,
Icelandic, Ido, Indonesian,
Interlingua, Italian, Inuit,
Kabardian, Kasub, Kawa,
Kikuyu, Kongo, Kpelle,
Kurdish, Latin, Latvian,
Lithuanian, Luba,
Luxembourgian,
Macedonian, Malagasy,
Malay, Malinke, Maltese,
Maori, Mayan, Miao,
Minankabaw, Mohawk,
Moldavian, Nahuatl,
Norwegian, Nyanja,
Occidental, Ojibway,
Papiamento, Pidgin English,
Polish, Portuguese
(Brazilian), Portuguese,
Provencal, Quechua,
Rhaetic, Romanian,
Romany, Ruanda, Rundi,
Russian, Sami Lule, Sami
Northern, Sami Southern,
Sami, Samoan, Sardinian,
Serbian (Cyrillic), Serbian
(Latin), Shona, Sioux,
Slovak, Slovenian, Somali,
Sorbian, Sotho, Spanish,
Sundanese, Swahili, Swazi,
Swedish, Tagalog, Tahitian,
Tinpo, Tongan, Tswana,
Tun, Turkish, Ukrainian,
Visayan, Welsh, Wolof,
Xhosa, Zapotec, Zulu
Readiris 12 Pro & 2009 American English, British
Corporate English, Afrikaans,
Albanian, Aymara, Balinese,
Basque, Bemba, Bikol,
Bislama, Brazilian, Breton,
Bulgarian, Byelorussian,
Catalan, Cebuano,
Chamorro, Corsican,
Croatian, Czech, Danish,
Dutch, Esperanto, Estonian,
French, Frisian, Friulian,
Galician, Ganda, German,
Greek, Greenlandic, Haitian
(Creole), Hani, Hiligaynon,
Hungarian, Icelandic, Ido,
Ilocano, Indonesian,
Interlingua, Irish (Gaelic),
Italian, Javanese,
Kapampangan, Kicongo,
Kinyarwanda, Kurdish,
Latin, Latvian, Lithuanian,
Luxemburgh, Macedonian,
Madurese, Malagasy,
Malay, Maltese, Manx
(Gaelic), Maori, Mayan,
Minangkabau, Nahuatl,
Norwegian, Numeric,
Nyanja, Nynorsk, Occitan,
Pidgin English, Polish,
Portuguese, Quechua,
Rhaeto-Roman, Romanian,
Rundi, Russian, Samoan,
Sardinian, Scottish (Gaelic),
Serbian, Serbian (Latin),
Shona, Slovak, Slovenian,
Somali, Sotho, Spanish,
Sundanese, Swahili,
Swedish, Tagalog, Tahitian,
Tok Pisin, Tonga, Tswana,
Turkish, Ukrainian, Waray,
Wolof, Xhosa, Zapotec,
Zulu, Bulgarian - English,
Byelorussian - English,
Greek - English,
Macedonian - English,
Russian - English, Serbian -
English, Ukrainian - English
+ Moldovan, Bosnian
(Cyrillic and Latin), Tetum,
Swiss-German and Kazak
Readiris 12 Pro & 2009 Arabic, Farsi and Hebrew
Corporate
Middle-East
Readiris 12 Pro & 2009 Simplified Chinese,
Corporate Traditional Chinese,
Asian Japanese and Korean
SmartZone v2 2008 English, Danish, Dutch,
Finnish, French, German,
Italian, Norwegian,
Portuguese, Spanish, and
Swedish
Computhink's 6.1 2008
ViewWise
CuneiForm 12 2007 English, German, French,
Spanish, Italian, Portuguese,
Dutch, Russian, Mixed
Russian-English, Ukrainian,
Danish, Swedish, Finnish,
Serbian, Croatian, Polish
and others
GOCR 0.47 2009
Microsoft Office 2007 2007 Language availability is tied
Office to the installed proofing
Document tools. For languages not
Imaging included in your version of
MS Office you'd need the
corresponding Proofing
Tools kit (separate
purchase).
Microsoft
Office
OneNote 2007
NovoDynamics Middle East 2005 Arabic, Persian (Farsi,
VERUS Professional Dari), Pashto, Urdu,
including embedded English
and French. It also
recognizes the Hebrew
language, including
embedded English.
NovoDynamics Asia 2009 Simplified and Traditional
VERUS Professional Chinese, Korean and
Russian languages,
including embedded English
Ocrad
Brainware
HOCR 0.10.13 2008 Hebrew
OCRopus 0.3.1 2008 All the languages and scripts
that Tesseract supports
through the Tesseract
plugin, and it supports Latin
script and English for its
native recognizers
ReadSoft
Alt-N
Technologies'
RelayFax
Network Fax
Manager
Scantron
Cognition
SimpleOCR 3.5 2008 English and French
SmartScore
Tesseract 2.03 2008 Can recognize 6 languages,
is fully UTF8 capable, and
is fully trainable
PLANTEAMIENTO DEL El objetivo final del sistema es la

generación de un fichero con los códigos
PROBLEMA ASCII correspondientes a los caracteres
de un texto en papel cuya imagen ha sido
Cuando se dispone de información en previamente capturado mediante el
forma de documento impreso y se desea escáner. Se trata, en definitiva, de un caso
procesarla mediante un computador, particular de Sistema de Reconocimiento
existen dos opciones: una primera Automático de Formas que, por tanto,
consistiría en introducirla a través del consta de una etapa de aislamiento de los
teclado, labor larga y tediosa. Otra objetos a reconocer (en este caso
posibilidad es automatizar esta operación caracteres impresos), otra de extracción
por medio de un sistema de OCR de sus características individuales y
compuesto de un software y hardware finalmente la aplicación de una función
adecuado que reduciría discriminante que permita establecer la
considerablemente el tiempo de entrada clase a la que pertenece cada objeto (en
de datos. En nuestro caso, el hardware este caso la clase de carácter, que estará
utilizado se reduce a un dispositivo de representada por su correspondiente
captura de imágenes (escáner) y a un código ASCII).
computador personal en el que se ejecuta
el software de reconocimiento
desarrollado a tal efecto.
ETAPAS DEL SISTEMA OCR DESARROLLADO.

Si la imagen contiene tanto texto como Una vez obtenido el vector de
gráficos, se procede a separarlos antes de características de cada uno de los
realizar cualquier otra operación. En caracteres incluidos en el documento, se
nuestro caso, esta separación es manual activa la etapa de reconocimiento que, en
mediante la selección, con el "ratón" del nuestro caso, consiste en una red neuronal
computador, de las áreas de interés en el que capaz de generar como salida el
documento. código ASCII de 8 bits del carácter cuyo
vector de características recibe como
Después de este procesamiento previo de entrada. Para que esto sea posible,
la imagen, se procede al aislamiento de previamente se ha sometido a la red
cada uno de los caracteres que forman el neuronal a un proceso de aprendizaje, en
texto que se está tratando y el cual se han utilizado documentos
posteriormente a la extracción de un impresos conteniendo diferentes juegos
conjunto de características capaces de de caracteres o abecedarios (todas las
definir cada carácter aislado. letras mayúsculas y minúsculas, los
dígitos del "0" al "9" y signos de
puntuación) con diferentes tamaños.
Durante este proceso se ajustan los Las conexiones sirven para transmitir las
parámetros internos de la red de forma salidas de unos nodos a las entradas de
reiterativa hasta que sea capaz de generar otros. El funcionamiento de un nodo es
como salida el código ASCII del carácter similar al de las neuronas biológicas
cuya imagen se presenta a su entrada, presentes en el cerebro. Suele aceptarse
para todas las formas y tamaños que la información memorizada en el
considerados para tal carácter. [5] cerebro está relacionada con los valores
sinópticos de las conexiones entre las
SOLUCION AL PROBLEMA CON neuronas. De igual forma, se dice que las
REDES NEURONALES. redes neuronales tienen la capacidad de
"aprender" mediante el ajuste de las
Las Redes Neuronales son sistemas de conexiones entre nodos. Estas conexiones
computación que permiten la resolución tienen un valor numérico asociado
de problemas que no pueden ser descritos denominado peso, que puede ser positivo
fácilmente mediante un enfoque (conexiones de excitación) o negativo
algorítmico tradicional, como, por (conexiones de inhibición).
ejemplo, ocurre en el reconocimiento de
formas. Con las redes se expresa la Existen muchos tipos de redes
solución de un problema, no como una neuronales, un modelo utilizado en una
secuencia de pasos, sino como la gran variedad de aplicaciones, entre las
evolución de un sistema inspirado en el que se incluyen las de reconocimiento de
funcionamiento del cerebro y dotado, por formas, es la red multicapa con
tanto, de cierta "inteligencia". Tal sistema conexiones unidireccionales hacia delante
no es sino la combinación de una gran (feedfoward). En la figura 2 se muestra la
cantidad de elementos simples de proceso red de este tipo utilizada en el sistema
(nodos o neuronas) interconectados que, OCR para el reconocimiento de
operando de forma masivamente paralela, caracteres.
consiguen resolver el problema.
Figura 2.- Estructura de la red neuronal utilizada

El tipo de red que se utilizará para darle la aproximación del modelo obtenido por
solución al problema del reconocimiento el algoritmo.
óptico de cárteres es una red neuronal
tipo multicapa denominada La especificación de los valores
backpropagation. entrada/salida se realiza con un conjunto
consistente en pares de vectores con
BACKPROPAGATION
entradas reales de la forma ,
La propagación hacia atrás de errores o conocido como conjunto de
entrenamiento o conjunto de ejemplos.
retropropagación es un algoritmo de
Los algoritmos de aprendizaje
aprendizaje supervisado que se usa para generalmente calculan los parámetros
entrenar redes neuronales artificiales. El
de una función que
algoritmo consiste en minimizar un error permiten aproximar los valores de salida
(comúnmente cuadrático) por medio de en el conjunto de entrenamiento.
gradiente descendiente, por lo que la parte
esencial del algoritmo es cálculo de las
Si , , son
derivadas parciales de dicho error con
los elementos del conjunto de
respecto a los parámetros de la red entrenamiento, la calidad de la
neuronal. aproximación en el ejemplo q se puede
medir a través del error cuadrático:
Minimización del Error
Los algoritmos en Aprendizaje

Automático pueden ser clasificados en
dos categorías: supervisados y no , donde es la norma euclidiana.
supervisados. Los algoritmos en
El error total es la suma de los errores de
aprendizaje supervisado son usados para los ejemplos:
construir "modelos" que generalmente
predicen unos ciertos valores deseados.
Para ello, los algoritmos supervisados
requieren que se especifiquen los valores .
de salida (output) u objetivo (target) que
se asocian a ciertos valores de entrada Un método general para minimizar el
(input). Ejemplos de objetivos pueden ser error es el actualizar los parámetros de
valores que indican éxito/fallo, venta/no- manera iterativa. El valor nuevo de los
parámetros se calcula al sumar un
venta, pérdida/ganancia, o bien ciertos
incremento al valor actual:
atributos multi-clase como cierta gama de
colores o las letras del alfabeto en nuestro
caso. El conocer los valores de salida
deseados permite determinar la calidad de
El algoritmo se detiene cuando
converge o bien cuando el error alcanza
un mínimo valor deseado.
Si la función usada para

aproximar los valores de salida es
diferenciable respecto a los parámetros
, podemos usar como algoritmo de
aprendizaje el método de gradiente
descendiente. En este caso, el incremento
de los parámetros se expresa como Los elementos que constituyen a la red
neuronal son los siguientes:
s es una función de valores reales,

conocida como la función de
donde 0 < γ < 1 es un parámetro conocido transferencia.
como factor de aprendizaje.
es la capa de entrada,
considerado como el vector
Antes de continuar introduciremos un extendido del ejemplo
poco de notación. Definimos
.
como el vector
extendido del vector
es la capa oculta, el vector
. El par extendido de
representará a un elemento del conjunto
de entrenamiento y una relación de .
entrada-salida, a menos que se indique
otra cosa.
es la
RED NEURONAL CON UNA CAPA capa de salida, considerado como el
OCULTA vector que aproxima al valor
deseado .
La función la usaremos para aproximar
los valores de salida de una red neuronal
artificial con una capa oculta. La red está es una matriz de tamaño
constituida por una capa de entrada (input cuyos valores
layer), una capa oculta (hidden layer) y
una capa de salida (output layer), tal son los pesos de la conexión
como se ilustra con la siguiente figura:
entre las unidades y .
es una matriz de tamaño

cuyos valores
son los pesos de la conexión
entre las unidades y .

3. Calcular las derivadas parciales del
De estos elementos, únicamente las error con respecto a los pesos
matrices son consideradas como que unen la capa oculta con

los parámetros de la red, ya que los la de salida.
4. Calcular las derivadas parciales del
valores son el resultado de cálculos error con respecto a los pesos
que dependen de las matrices de pesos,
del valor de entrada y de la función de que unen la capa de entrada
transferencia s. con la oculta.
5. Ajustar los pesos de cada neurona
para reducir el error.
6. Repetir el proceso varias veces por
La función de transferencia s que
cada par de entradas-salidas de
consideraremos en nuestro algoritmo es
prueba. [16]
conocida como función sigmoidal, y esta
definida como
Cuando se trabaja con redes neuronales
como la que se utiliza en este trabajo, se
distingue entre una primera etapa de
aprendizaje o entrenamiento de la red y
una segunda etapa de funcionamiento u
esta función además de ser diferenciable, operación de la red. En la primera se
tiene la particularidad de que su derivada realiza el ajuste de los pesos en función
se puede expresar en términos de sí de lo que se desea que almacene la red.
misma: Se suele distinguir entre dos tipos de
aprendizaje: supervisado o no
supervisado.
La red utilizada en el sistema de OCR,

tiene un aprendizaje supervisado, el cual
esto nos servirá para simplificar los
consiste en el ajuste de los pesos para que
cálculos en el algoritmo de aprendizaje
"aprenda" a relacionar un conjunto de
aquí descrito.
patrones de entrada con las salidas que se
desea que la red genere ante cada uno de
DESCRIPCIÓN DEL ALGORITMO
dichos patrones. El entrenamiento
concluye cuando la diferencia entre las
A grandes rasgos:
salidas deseadas ante cada patrón y las
que se obtienen realmente con los valores
1. Calcular la salida de la red a calculados de los pesos es
partir de uno de los conjuntos de suficientemente pequeña.
valores de prueba x.
2. Comparar con la salida correcta t y
calcular el error según la fórmula:
A partir de este momento los pesos no caracteres, se supone que ha aprendido a
varían y la red entraría en una fase distinguir entre diferentes tipos de
operacional para cumplir la función que imágenes de caracteres de entrada y a
se desea de ella. Por ejemplo, si se va a asociar a cada una un carácter del
utilizar para reconocimiento de alfabeto.
[8]
Como se representá en la figura 2, la capa el hecho de tener más neuronas supone

de entrada de la red utilizada consta de 35 más de conexiones entre ellas y por tanto,
neuronas que corresponden a los 35 debe hacer mayor número de operaciones
valores (matriz de 7x5) que se extraen de empleando más tiempo en cada ciclo de
la parametrización de un carácter [9]. Se aprendizaje. [5]
eligió este número para que las
características extraídas fuesen lo Concretando, un perceptron multicapa
suficientemente relevantes para distinguir tiene tres características:
unos caracteres de otros. Dado el tamaño
de los caracteres en pixeles, una matriz
menor podría dar lugar a más confusión,
una mayor sería redundante y emplearía
un tiempo computacional mayor, aunque
el límite final lo tenemos en la memoria
disponible en el sistema. 1. El modelo de cada neurona (figura 3)
incluye una función no lineal. En este
En la capa oculta se pueden tener hasta 35 caso, a diferencia del perceptrón donde es
neuronas, las que en la de entrada. Se la función escalón, y debido a la
precisan más neuronas ocultas si el juego necesidad de que sea una función
de caracteres que debe aprender la red es continua y derivable, es la función
grande, para que el proceso de sigmoide, donde uk es la suma total de la
entrenamiento converja. Como se actividad interna en la neurona k (la señal
comentará en el apartado de resultados, de entrada) e yk la salida que se produce
con más neuronas la red converge antes, en la neurona.
además de cometer menos fallos en el
reconocimiento, aunque en contrapartida,
2. La red contiene una o más capas
ocultas de neuronas que no forman parte TOOLBOX DE
ni de la entrada ni de la salida. Estas REDES NEURONALES (LIBRERIAS
neuronas ocultas capacitan a la red para MATLAB)
aprender progresivamente cualquier
correspondencia entre la entrada y la Para trabajar con redes neuronales,
salida y almacenar internamente esta seguramente podremos encontrar con una
información. simple búsqueda en Internet un gran
número de API’s y frameworks que
3. La red posee un gran número de implementen por nosotros la estructura de
conexiones, estas vienen determinadas la mayor parte de los tipos de redes y la
por los pesos de la red. Un cambio en la funciones necesarias para trabajar con
conexión entre las neuronas equivale a un ellas. Uno de estos frameworks es el
cambio en los pesos. [6] Toolbox que matlab posee, que nos ofrece
una implementación genérica de redes
IMPLEMENTACION CON MATLAB neuronales, así como implementaciones
de redes neuronales concretas como las
Debido al poder de la herramienta de perceptrón, backpropagation, Som, etc.
matlab y la existencia de unas librerías
(toolbox de redes neuronales) que nos Estructura
facilitan el trabajo con las redes
neuronales, se ha considerado Matlab utiliza una estructura única que
implementar lo que es el reconocimiento nos dará acceso a todas las propiedades
de caracteres con la misma para ello de la red neuronal, independientemente
vamos a revisar primero la estructura de del tipo que esta sea, de manera que
las librerías, sus funciones y como utilizando esta propiedad podremos
trabajan. modificar las entradas, capas, conexiones,
pesos, etc. De esta manera una vez
configurada la red neuronal según 5. Valores:
nuestras necesidades invocaremos las
funciones de manipulación de redes Aquí se definen las matrices con
neuronales disponibles en matlab, los valores de los pesos de
(simulación, entrenamiento, entrada, conexiones entre capas y
inicialización, etc.), pasándole como bías.
parámetro la estructura de la red neuronal.
Funciones
net = network;
Una vez creada la red neuronal, para
Si ejecutamos el comando anterior y trabajar con la misma, podremos utilizar
visualizamos el contenido de la variable las siguientes funciones para realizar las
myNetwork se nos vializará la estructura operaciones típicas:
mencionada, la cual se puede dividir en
cinco secciones: 1. Inicialización (net = init(net)):
1. Arquitectura: Mediante la función de

inicialización, obtenemos una red
Define las características básicas neuronal con los valores de los
de la red neuronal, número de pesos y bias actualizados según
entradas, capas, conexiones de las funciones de inicialización que
bias, etc. le hayamos asociado a la red,
mediante su propiedad net.initFcn,
2. Subobjetos: o bien net.layers{i}.initFcn y
net.biases{i}.initFcn.
Contiene referencias a las
subestructuras de la red neuronal, 2. Entrenamiento ([net, tr, Y, E,
que nos permitirán configurar las Pf, Af] = train(net, P, T, Pi, Ai,
propiedades de los distintos VV, TV);):
componentes que forman la red
(capas, entradas, salidas, etc.). Realiza el entrenamiento de la red
neuronal, modificando los pesos
3. Funciones: asociados a las conexiones entre
las diferentes capas y neuronas de
Funciones principales de la red la misma. Para esto, debemos
neuronal, utilizadas para ejecutar indicar unos patrones de entrada a
las operaciones de inicialización, la red (P, matriz de dimenesiones
entrenamiento o simulación. MxN siendo M la suma de los
tamaños de las capas de entrada
4. Parámetros: de la red neuronal, y N el número
de patrones que deseamos aplicar
Configuración de los parámetros en el entrenamiento). En caso de
asociados a las funciones ser un entrenamiento supervisado
seleccionadas en el bloque de también indicaremos los targets
funciones. (T, matriz de MxN), con estos
datos la matriz de patrones se
aplica a la red neuronal, y el
toolbox utilizando las funciones Mapas Autoorganizados: newsom(P,S)
de entrenamiento que le hemos [13].
indicado en las propiedades
“trainFcn” se encargará de PASOS A SEGUIR PARA LA
actualizar los pesos asociados a IMPLEMENTACION EN MATLAB
las conexiones de la red. Los
resultados del entrenamiento los A la hora de aplicar redes neuronales, y
obtendremos en la variable de en general para cualquier problema de
retorno Y y los errores para cada reconocimiento de patrones, hay una serie
patrón de entrada respecto a la de pasos que serán comunes a la mayoría
salida esperada en la variable de de los problemas.
retorno E.
1. Representación original de los
3. Simulación ([Y, Pf, Af, E, perf] datos
= sim(net, P, Pi, Ai, T)): 2. Preprocesamiento de los datos
originales para codificarlos en un
Función parecida a la anterior formato apropiado para la red
pero que no actualizará los pesos neuronal.
de la red neuronal. Una vez que 3. Procesamiento de la información.
tengamos entrenada la red (aplicación de la red neuronal)
neuronal y esta ofrezca unos 4. Interpretación de los resultados.
resultados válidos, utilizaremos [10]
esta función para analizar nuevos
patrones de entrada.
1. Representación de la
Redes neuronales conocidas
información original.
Lo primero que deberemos tener en

Normalmente a la hora de trabajar con
cuenta, será la representación original de
redes neuronales, querremos trabajar con
los datos que deberemos procesar, en este
un tipo de red neuronal concreto, el cual
caso, el de reconocimiento de caracteres
se ajuste mejor a nuestras necesidades. En
manuscritos, vamos a partir de una
este caso en vez de utilizar la función
imagen, o conjunto de píxeles en blanco y
“network” para la creación de la
negro que contendrán el carácter a
estructura base, podemos utilizar
reconocer.
funciones específicas para cada tipo de
red neuronal, de manera que la estructura
base que matlab nos devuelva tenga una 2. Preprocesamiento de los datos
configuración de capas de entrada, originales para codificarlos en un
ocultas, conexiones etc. apropiada para el formato apropiado para la red
tipo de red neuronal deseado. neuronal.
1. Perceptron: newp(P,S) Para aplicar la información con el
2. Backpropagation: newff(P, carácter manuscrito a la red neuronal,
[S1,…., Sn]) deberemos realizar algún tipo de
3. Radiales: newgrnm(P,T) procesamiento para obtener la
información apropiada que le pasaremos dicha imagen obtendríamos un array de
como entrada a dicha red. 40.000 elementos siendo necesario una
red neuronal con el mismo número de
En este caso, lo que haremos será generar entradas. Para optimizar mejor esto,
un array de valores enteros 0 o 1, de vamos a procesar tan solo aquella zona de
manera que un 1 significa que hay algo la imagen donde esté el dígito manuscrito
pintado y 0 no, de manera que este array y además, vamos a dividir esta zona en
de valores discretos será la información una cuadrícula de por ejemplo 7×5 en
que pasaremos a la entrada de la red nuestro caso, de manera que generaremos
neuronal. un vector de 35 elementos,
correspondiendose cada elemento con una
Algo a tener en cuenta es el tamaño del de esas zonas en las que hemos dividido
vector generado a partir de la imagen, por el dígito manuscrito y en caso de que
ejemplo si la imagen original tiene un algún píxel de dicha zona esté pintado
tamaño de 200×200 pixeles, y creamos un pondremos un uno y en caso contrario un
array con un valor para cada píxel de cero.
[8]
Vector para el patron x = Como hemos dicho, la entrada de la red

(1,1,1,1,1,1,0,0,0,0,1,0,0,0,0,1,1,1,1, neuronal, será un array de 64 elementos
0,1,0,0,0,0,1,0, 0,0,0,1,1,1,1,1) conteniendo la información de los píxeles
pintados en la imagen, así que
necesitaremos una red neuronales de 64
PROCESAMIENTO DE LA entradas, de manera que en cada entrada
INFORMACIÓN se le aplicará un uno o un cero indicando
la existencia de un trazo en dicha zona de
Creación de la Red neuronal en la imagen.
matlab
Como el objetivo es reconocer 27
Una vez tenemos creado el vector caracteres (de la a a la z), o mejor dicho,
representando el caracter manuscrito, el objetivo es que la red neuronales
queremos ser capaces de procesarlo para aprenda a clasificar los patrones de
detectar el caracter real que el usuario a entrada en 27 clases diferentes, la red
escrito. En este caso sencillo, nos neuronal dispondrá de 27 salidas, una
centraremos en predecir los caracteres para cada carácter, de manera que tan
manuscritos, para lo cual vamos a utilizar solo se activará la salida correspondiente
una red neuronal de tipo backpropagation al carácter reconocido.
[7], y como implementación el toolbox de
redes neuronales de matlab. 3.1 Creación de la red neuronal
Para la creación y simulación de la red A continuación creamos la red neuronal
neuronal, hemos generado primero una con la función newff que es del tipo
serie de patrones de muestra para cada Backpropagation: La red neuronal
uno de los caracteres que queremos Backpropagation presenta una gran
reconocer (35 unidades). variedad de opciones de configuración,
dependiendo de la necesidad de
aprendizaje y de la aplicación que se este
patrón(a) desarrollando.
1;1;1;1;0;1;1;0;1;1;0;1;1;1
;1,...,0
patrón(b) Este tipo de red requiere que le sean
1;1;1;1;0;1;1;0;1;1;0;1;1;1 especificados los siguientes parámetros
;1,...,0
patrón(c)
1;1;1;1;0;1;1;0;1;1;0;1;1;1
newff: (PR,[S1 S2...SNl],{TF1
;1,...,0 TF2...TFNl},BTF,BLF,PF)
patrón(d)
1;1;1;1;0;1;1;0;1;1;0;1;1;1 PR : Rx2 Matriz de valores máximos y
;1,...,0 mínimos de cada uno de las R neuronas
…
de entrada.
patrón(z)
1;1;1;1;0;1;1;0;1;1;0;1;1;1 Si : Número de neuronas para cada una de
;1,...,0 las capas.
En segundo lugar, también tenemos la TFi : Función de transferencia a utilizar

información de la salida que la red en cada una de las capas, por defecto
neuronal deberá generar para cada uno de utiliza tansig
estos patrones (26 caracteres).
BTF : Algoritmo de entrenamiento a
utilizar, por defecto utiliza trainlm
1;0;0;0;0;0;0;0;0,...,0:represent
a ’a’
0;1;0;0;0;0;0;0;0,...,0:represent BLF : Función de actualización de los
a ’b’ pesos, por defecto utiliza learngdm.
0;0;1;0;0;0;0;0;0,...,0:represent
a ’c’ PF : Función para evaluar el desempeño
0;0;0;1;0;0;0;0;0,...,0:represent
a ’d’ de la red, por defecto utiliza mse.[12]
…
>>net=newff(minmax(alphabet),[S1
0;0;0;1;0;0;0;0;0,...,1:represent S2],{'logsig' 'logsig'},'traingdx');
a ’z’
En este caso S1 y S2 representa el
Así, pues primero cargaremos dicha número de neuronas de la capa oculta, en
información en matlab. este caso se utiliza como función de
transferencia para ambas capas ocultas la
load matlab_pattern.txt
función logsig y la función de
load matlab_targets.txt entrenameinto que se utilizara será
traingdx.
Selección del número de capas ocultas Regla Tres: La cantidad de datos
disponibles de formación establece un
Para casi todos los problemas, una capa límite superior para el número de
oculta es suficiente. Dos capas ocultas elementos de proceso en la capa
son necesarias para el modelado de datos oculta. Para calcular este límite
con discontinuidades, como un patrón de superior, utilice el número de casos en
onda de diente de sierra. Mediante el uso el conjunto de datos de entrenamiento
de dos capas ocultas rara vez mejora el y luego dividir esa cifra por la suma
modelo, y puede introducir un mayor del número de nodos en la entrada y
riesgo de convergencia a un mínimo salida de las capas de la red. Luego
local. No hay ninguna razón teórica para divida ese resultado una vez más por
la utilización de más de dos capas ocultas. un factor de escala entre cinco y diez.
[14] Factores de escala mucho más
grandes se utilizan para los datos
Decidir el número de neuronas a relativamente menos ruidosos. Si se
utilizar en la capa oculta usa demasiadas neuronas artificiales
el conjunto de entrenamiento será
Una de las características más memorizado. Si eso ocurre, la
importantes de una red perceptrón es el generalización de los datos no se
número de neuronas en la capa oculta (s). producirá, haciendo inútil la red en los
Si se tiene un número insuficiente de nuevos conjuntos de datos. [15]
neuronas que se utilizaran, la red no
estará en condiciones de representar un En un estudio de Optimización de
modelo de datos complejo, y por Motores de Inferencia Conexionistas
consiguiente los ajustes de pesos serán Mediante Algoritmos de Poda y Lógica
pobres.
Difusa se propone hacer lo siguiente para
Sólo hay normas generales recogidas en conseguir un número adecuado de nodos
el tiempo y seguidas por la mayoría de los ocultos:
investigadores e ingenieros de
aplicaciones de este tipo de arquitectura. Un criterio de optimización es buscar
aquellos valores de salida insignificantes
Regla Uno: Como la complejidad de de los nodos ocultos al finalizar el
la relación entre los datos de entrada y proceso de aprendizaje, innecesarios en
la salida deseada aumente, el número este proceso. Podemos organizar la
de elementos de proceso en la capa información de los valores de salidas de
oculta también debe aumentar. los nodos ocultos en una matriz de N
Regla dos: Si el proceso es separable columnas (#nodos ocultos) y M filas
en varias etapas, entonces, más capas (#patrones a aprender), de esta manera
ocultas pueden ser requeridas. Si el podemos analizar los valores de salida
proceso no es separable en etapas, asociados a cada neurona y en conjunto
entonces, capas adicionales decidir si esa neurona es influyente en el
permitirían la memorización del aprendizaje. Este proceso se observa en la
conjunto de entrenamiento, y no una siguiente figura.
verdadera solución general eficaz con
otros datos.
La matriz describe la participación de 3.2 Entrenamiento de la red neuronal
cada nodo oculto por cada patrón de
aprendizaje, de lo cual podemos Una vez creada la red neuronal, y como
distinguir a simple vista aquellos que son ya tenemos los patrones de entrenamiento
útiles y aquellos que no lo son. Esta con sus respectivos targets cargados en
opción puede ser óptima para redes matlab, tan solo nos queda invocar a la
pequeñas, pero resulta ser muy función train.
complicada de utilizar cuando tratamos
con redes medianas y peor aun con redes
de mayor tamaño, para lo cual net = train(net,P,T);
necesitamos una representación más
explicita de la información la de utilidad Con esto matlab comenzará a entrenar la
de las salidas de los nodos ocultos red neuronal hasta alcanzar el
representados por las columnas de la performance deseado, abriéndosenos una
matriz. [11] ventana con la información de dicho
proceso.
Listo, ya tenemos la red neuronal creada 3.3 Simulación de la red neuronal

con los parámetros por defecto. Podemos
navegar un poco por la estructura del Pues nada, una vez entrenada la red
objeto “net” para asegurarnos de que todo neuronal, ya podemos aplicar un patrón
está correcto. real a la entrada y ver en la salida la clase
(o caracter) en la que se ha clasificado.
>>net
[val,num] = sim(net,
net.inputs{1} [1;1;1;0;0;1;0;1;1;...;1;1]);
net.numlayers val =0.0000
net.outputs{1} 0.0008
… 1.0013
0.0005 parezca al valor 1) será la que tomaremos
0.0003 como salida activa indicando el carácter
0.0012
-0.0004 reconocido.
0.0004
-0.0006 Para terminar, simplemente mostraros una
0.0011 captura de pantalla de nuestra
implementación con matlab.
En este caso, de las diez salidas todas
tienen un valor muy cercano a cero,
excepto la salida correspondiente al dígito
dos, que tiene un valor muy cercano a
uno, siendo este el dígito reconocido.
4. Interpretación de los resultados
En este caso, los resultados son fáciles de

interpretar como hemos visto en el
apartado anterior, la salida de la red
neuronal que tenga valor 1 (o que más se
ni muy redundante ni tampoco

CONCLUSIONES
información no relevante.
 La característica mas importante  Matlab posee sus librerías de

del algoritmo backpropagation es redes neuronales que nos
su capacidad para la proporcionan funciones con las
generalización es decir su cuáles nos permiten manejar las
facilidad para salidas satisfactorias mismas de una manera muy
a entradas que el sistema nunca genérica adaptándolas a cualquier
vio en la fase de entrenamiento aplicación que se desee construir.
esta característica le da
versatilidad para que este puede  En el preprocesamiento de la
ser implementado en aplicaciones imagen se debe considerar que los
muy complejas. limites de la imagen estén justo en
los limites del carácter para que se
 En el preprocesamiento de las ajuste solamente el carácter a la
imágenes que contienen los matriz en la que se almacenan las
caracteres se debe considerar el características, además para tratar
tamaño de la matriz que posee la imagen como espacios en
información de las características blanco o llenos se debe pasar la
de cada carácter, pues no debe ser imagen a binario (blanco o negro)
(0 o1).
comercial-
 El número de nodos de la red siete/2008/5/26/reconocimiento-
neuronal esta muy ligado al optico-carateres-ocr-
número de patrones que tenga el
caso en estudio en nuestro caso [3] Jonatan –blog Estudiante de
como se trata de reconocer las Ingeniería Civil en Informática, UdeC.
letras minúsculas se tiene Actualmente Presidente de Centro de
entonces 27 patrones, por lo tanto Alumnos de la carrera. Ayudante docente
se parte también con 27 neuronas. de Computación y Programación 2-2008,
Proyectos de Sistemas Informáticos
 Si se quiere un numero de Historia de OCR, http://psi-
neuronas que optimicen el tiempo g5.blogspot.com/2007/08/estado
que le toma a la red realizar la -actual-de-la-tecnologa-ocr.html
clasificación se puede recurrir a
una matriz de resultado obtenidos
después del enteramiento aquí [4] Wikipedia, Optical character
analizaríamos las neuronas y su recognition, editado en octubre del 2008,
poder de decisión frente a los http://en.wikipedia.org/wiki/Opti
patrones y dependiendo si la
neurona tiene una influencia cal_character_recognition
grande al momento de la
clasificación la podríamos [5] José R. Hilera González, Juan P.
descartar o no. Romero Villaverde, Jose A. Gutiérrez de
Mesa, Departamento de Ciencias de la
Computación, Universidad de Alcalá de
REFERENCIAS Henares,
http://www.cc.uah.es/hilera/docs
/1996/c_jiacse1/c_jiacse1.htm
[1] Jonatan –blog Estudiante de
Ingeniería Civil en Informática, UdeC. [6] Emiliano Aldabas-Rubira, UPC-
Actualmente Presidente de Centro de Campus Terrassa-DEE-EUETIT Colom,
Alumnos de la carrera. Ayudante docente Introducción al reconocimiento de
de Computación y Programación 2-2008, patrones mediante redes neuronales,
Proyectos de Sistemas Informáticos
http://www.jcee.upc.es/JCEE200
2/Aldabas.pdf
Historia de OCR, http://psi-
g5.blogspot.com/2007/08/histori [7] Daniel Saucedo Aranda,
a-ocr.html Departamento de Ciencias de la
Computación e Inteligencia Artificial,
Escuela Técnica Superior de Ingeniería
[2] ldpalma, Informatica en C7, Informática,
Reconocimiento Optico de Carateres http://decsai.ugr.es/~castro/MCII
(OCR), Estado actual de la tecnología /Transparencias/RN3.pdf
OCR, editado el 26 Mayo 2008,
http://blogs.clarin.com/el-
[8] Drob, Redes neuronales, neuronales, DESCRIPCIÓN DE LAS
Reconocimiento de patrones, editado el FUNCIONES UTILIZADAS EN
06/28/2008 MATLAB, universidad tecnológica de
http://www.scribd.com/doc/3684 Pereira, facultad de ingeniería eléctrica,
177/Redes-Neuronales http://ohm.utp.edu.co/neuronale
s/Anexos/AnexoA.htm
[9] Ricardo Conejo Muñoz,
Departamento de Lenguajes y Ciencias de [13] Poncos, Matlab: toolbox de
la Computación redes neuronales, Introduccion, editado el
14 Abril 2008,
Universidad de Málaga, Complejo
http://poncos.wordpress.com/20
Tecnológico, Campus de Teatinos,
08/04/14/matlab-toolbox-de-
http://www.lcc.uma.es/~jmortiz/a redes-neuronales/
rchivos/Tema5.pdf
[14] DTREG, Software For Predictive
[10] Poncos, Matlab: Modeling and Forecasting - Multilayer
ejemplo backpropagation, editado el 15 Perceptron Neural Networks,
Enero del 2009, http://www.dtreg.com/mlfn.htm
http://poncos.wordpress.com/20
09/01/15/matlab-ejemplo- [15] Julian Simon, a professor in the
backpropagation/ University of Maryland's Business
School, Classification - Neural Networks
[11] José Talavera Herrera, Omar Vivas- Prediction,
Arapa, Ernesto Cuadros-Vargas, http://www.resample.com/xlmine
Optimización de Motores de Inferencia r/help/NNC/NNClass_intro.htm
Conexionistas Mediante Algoritmos de
Poda y Lógica Difusa,
http://www.usp.edu.pe/~ecuadro [16] Wikipedia, Propagación hacia atrás -
s/papers/Paper263CLEI2002.pdf La propagación hacia atrás de errores o
retropropagación, editado 18 mar 2009,
[12] Maria Isabel Acosta, Halord Salazar, http://es.wikipedia.org/wiki/Back
Camilo Zuluaga, Tutorial de redes propagation

Reconocimiento Óptico de Caracteres (Ocr) Con Redes Neuronales

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Reconocimiento Óptico de Caracteres (Ocr) Con Redes Neuronales

Загружено:

Авторское право:

Доступные форматы

RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR) CON REDES NEURONALES

ESTADO DEL ARTE

Juan Pablo Ordóñez L.

RESUMEN conversion of written text on paper to text

Software OCR y los lenguajes que soporta. [4]

ExperVision 7.0 English, French, German,

PLANTEAMIENTO DEL El objetivo final del sistema es la

ETAPAS DEL SISTEMA OCR DESARROLLADO.

Figura 2.- Estructura de la red neuronal utilizada

Los algoritmos en Aprendizaje

Si la función usada para

s es una función de valores reales,

es una matriz de tamaño

entre las unidades y .

matrices son consideradas como que unen la capa oculta con

La red utilizada en el sistema de OCR,

Como se representá en la figura 2, la capa el hecho de tener más neuronas supone

1. Arquitectura: Mediante la función de

Lo primero que deberemos tener en

Vector para el patron x = Como hemos dicho, la entrada de la red

En segundo lugar, también tenemos la TFi : Función de transferencia a utilizar

Listo, ya tenemos la red neuronal creada 3.3 Simulación de la red neuronal

4. Interpretación de los resultados

En este caso, los resultados son fáciles de

ni muy redundante ni tampoco

 La característica mas importante  Matlab posee sus librerías de

Вам также может понравиться