Вы находитесь на странице: 1из 10

06: Reconocimiento oral de palabras

6.0. Reconocimiento oral de palabras

Se estima que una persona con una cultura media de bachillerato conoce, en su sentido más
amplio, entre 40.000 y 80.000 palabras.
Normalmente la palabra se considera la unidad mínima de una lengua dotada de significado,
aunque en sentido estricto, sea el morfema la unidad mínima con significado. Los morfemas
pueden constituir palabras por sí mismos (morfemas libres) o ser apéndices de otras palabras
(morfemas ligados) modificando el significado.
Cabe distinguir entre distintos tipos de morfemas:

 Morfemas derivativos. Los morfemas derivativos pueden ir delante ( prefijos ) o detrás


( sufijos ) de la raíz o lexema.
 Morfemas flexivos. Establecen el género y número en sustantivos y adjetivos, y también el
modo y tiempo en el caso de los verbos.

Además del significado, al evocar una palabra se activa información fonológica, información
ortográfica, e información morfológica y sintáctica, correspondiente a un conocimiento implícito,
con independencia de que se haya estudiado o no.

6.1. Estructura y organización del léxico

A pesar de la diversidad lingüística, los vocabularios de las distintas lenguas se ajustan a unos
principios generales.

Dos categorías de palabras

Es posible distinguir entre dos clases de palabras muy diferentes que se procesan de forma
distinta en el cerebro humano:

a. Categorías mayores o de clase abierta o palabras de contenido: conjunto de palabras que


no cesa de incorporar nuevos términos a lo largo del tiempo y que poseen un significado
pleno (nombres, verbos, adjetivos y algunos adverbios).
b. Categorías menores o de clase cerrada o palabras de función o functores. Modifican el
significado de las otras palabras y establecen relaciones entre ellas (artículos,
preposiciones, conjunciones, auxiliares, etc.).

La representación y el procesamiento de ambos tipos de vocabulario presentan importantes


diferencias:

 Una lesión cerebral puede afectar selectivamente más a un tipo de vocabulario que al


otro.
 En el desarrollo de la primera lengua se observa que la aparición del vocabulario de clase
cerrada es mucho más tardía que la del vocabulario de clase abierta.
 La frecuencia de uso es una variable que tiene un gran efecto en la identificación de las
palabras, pero sólo con las de contenido. Numerosos estudios han puesto de manifiesto
que las palabras de función presentan mayor invisibilidad en tareas que consisten en
identificar rápidamente una letra particular sobre un texto.
Organización léxica

La comprensión es la culminación de un conjunto complejo de subprocesos que ocurren de


forma rápida y automatizada, consistente en emparejar información externa del estímulo con
estructuras de información pre-almacenadas.
Según Oldfield, tradicionalmente se había propuesto el concepto de diccionario o léxico
mental como la hipotética estructura donde se representaría esta información de manera
organizada.
El léxico mental consta de una lista o red de “entradas léxicas” que incorpora información
fonológica, ortográfica, morfológica, sintáctica, semántica y términos o conceptos asociados a la
entrada léxica por sus significados.
De esta forma, no todas las entradas estarían completas sino que puede fallar la conexión entre
algunas de esas representaciones.

Acceso léxico

Una de las hipótesis que explica cómo se representan las variantes morfológicas de las palabras,
denominada hipótesis del listado exhaustivo, considera que cada variante tiene su entrada o
representación propia.
Por otra parte, la hipótesis del listado parcial o segmentación obligatoria defiende que el léxico
sólo contiene una lista parcial de entradas léxicas que incluye, por un lado las raíces o  formas
base, y por otro los afijos (prefijos y sufijos).
Según esta hipótesis, para identificar una palabra morfológicamente compleja, primero hay que
“despojarla” de todos los afijos y luego localizar su forma base.
Los datos empíricos parecen apoyar esta hipótesis, por ejemplo, el hecho de que los tiempos de
reacción de palabras seudo-prefijadas como “interés” o “resultado” que realmente no tienen
prefijos pero tienen apariencia de tenerlos (in- y re-, respectivamente), se procesan más
lentamente que las palabras control.
Por otra parte, los datos empíricos apoyan de forma clara una síntesis de ambas hipótesis.
De acuerdo con la hipótesis mixta o dual, por un lado se encontrarían las raíces y por otro lado
los afijos. Así, ambas partes se procesan por separado y posteriormente se unen.
Este procedimiento es especialmente útil con las palabras de baja frecuencia, pues no es
necesario conocer todas las formas derivadas para entender y utilizar una forma concreta.
Un factor que influye en la descomposición de las palabras es el grado de transparencia que
éstas tienen para nosotros. Si una palabra compuesta no es transparente respecto a sus
componentes se representará como otra palabra aparte (ej. “camaleón” no es transparente
respecto a sus componentes “cama” y “león”, almacenandose independientemente).
Paralelamente, una distinción que se ha revelado útil es aquella que discierne entre
una morfología de nivel I, en la que se produce una alteración de la raíz (de soñar a sueño), y
una morfología de nivel II, donde no se altera la raíz (de comer a comedor).
Otros autores, generalmente conexionistas, consideran innecesario plantear un mecanismo de
acceso separado del mecanismo de activación léxica.
Sin embargo, en el reconocimiento de las palabras habladas, la mayor parte de los enfoques
teóricos sobre el acceso léxico comparten la idea de que intervienen dos tipos de mecanismos
fundamentales: activación y competición.
6.2. Metodologías experimentales en reconocimiento oral de palabras

Técnica gating (apertura sucesiva)

Técnica propuesta por F. Grosjean que consiste en la presentación de un estímulo lingüístico


(habitualmente una palabra monosílaba) a través de sucesivos segmentos de duración creciente,
hasta que puede ser identificado.

Detección de estímulos (monitoring)

La detección de estímulos fue una metodología propuesta por Foss consistente en responder


rápidamente, pulsando un botón, cada vez que aparece un estímulo determinado. Así, el tiempo
de reacción para la detección del estímulo se considera un reflejo de la carga de trabajo que tiene
el sistema cognitivo en ese momento.

Decisión léxica

Se trata de una de las tareas más usadas en la psicolingüística, tanto en la modalidad auditiva
(McCusker, Holley-Wilcox y Hillinger) como en la visual (Rubenstein).
En la tarea visual, el participante debe decidir rápidamente si un estímulo formado por un
conjunto de letras es una palabra de su idioma o no lo es, mientras que en la  tarea auditiva, el
participante debe decidir si los sonidos que escucha, normalmente a través de unos auriculares,
forman o no una palabra.
El participante tiene que emitir su respuesta pulsando un botón o una tecla del ordenador, entre
dos posibles; el botón del sí (palabra) y el botón del no (no-palabra). Aquí, la  variable
dependiente es el tiempo de reacción, siendo 500-700 ms los tiempos habituales, y la proporción
de errores.
También existen estudios sobre el significado de las palabras, donde se emplean tareas de
decisión o categorización semántica, tareas de categorización sintáctica, como la decisión de
género y otras.
Este procedimiento permite en castellano el estudio de procesos genuinamente gramaticales
(morfosintácticos), porque en el idioma el género de muchos sustantivos no tiene conexión con
ninguna propiedad semántica (atributos sexuales) del referente, como la palabra libro, que
designa un objeto que no posee atributos masculinos.
A partir de Cutler y Norris se han introducido la tarea de localización de palabras, sobre todo en
investigaciones sobre la influencia de la estructura prosódica del lenguaje (entonación y ritmo) en
el reconocimiento léxico, presentando cierta validez ecológica (Wordspotting). En este tipo de
tarea se administra auditivamente una lista de no-palabras, o palabras sin sentido, algunas de las
cuales incluyen en su interior una palabra que el participante debe detectar lo más rápidamente
posible (por ejemplo “sal” en “salpe”).

6.3. Variables que influyen en el reconocimiento de las palabras

En ocasiones los experimentos sobre el reconocimiento de palabras son difíciles de interpretar


porque existen otros procesos añadidos que pueden contaminar los resultados.
❖ El punto de unicidad es el punto de la palabra en el que se convierte en única del idioma, ya
que no hay ninguna otra que comience por esos mismos fonemas (por ejemplo, “elf” en elefante).
Sin embargo, existen palabras que tienen el punto de unicidad al final, por lo que hay que esperar
a percibir todos los fonemas para reconocerla.
❖ Frecuencia léxica. Las palabras usadas con más frecuencia en un idioma se identifican más
fácilmente y con mayor rapidez que las empleadas con menos frecuencia. Se han elaborado
diccionarios de frecuencia en la mayoría de los idiomas para poder cuantificar de manera fiable la
variable de frecuencia, extraída de ámbitos muy variados (literatura, revistas, etc). Las palabras
más frecuentes son de función (de, la, que, y, el, en).
El corpus LEXESP incluye un conjunto de unos 5 millones de unidades léxicas escritas que ofrece
la frecuencia absoluta y relativa, la familiaridad, concreción, imaginabilidad, etc. En los últimos
años se han construido diccionarios a partir de los subtítulos de las películas y series televisivas.
Mediante trabajos con técnicas de detección de fonemas, Foss encontró que las latencias para
detectar el fonema eran claramente más cortas después de una palabra frecuente, porque
exigía menor carga de procesamiento. Aunque realmente, la verdadera variable psicológica es la
familiaridad subjetiva que las personas tienen con cada palabra, los resultados demuestran que
estas puntuaciones guardan una estrecha relación con los índices objetivos obtenidos en los
recuentos estadísticos, y el coeficiente de correlación es alto (r > 0,80). Por esta razón y por
motivos prácticos, en los experimentos suelen emplearse los índices objetivos de los diccionarios
de frecuencias.
Balota y Chumbley ponen de manifiesto que si la frecuencia fuera una variable que influye
directamente en el acceso léxico, entonces su efecto debería ser patente en cualquier tarea que
implique acceso léxico, pero no siempre ocurre así. En una tarea de categorización semántica, en
la que los participantes debían decidir rápidamente si una entidad determinada pertenecía a una
categoría semántica previamente fijada. Balota y Chumbley interpretaron que el efecto de la
frecuencia encontrado en otros estudios, sobre todo en los basados en la tarea de decisión léxica
era debido a las peculiaridades de la propia tarea, concretamente, al propio proceso de  toma de
decisión. De esta forma, consideran que la frecuencia de uso no influye realmente en el acceso al
léxico mental, sino en el proceso posléxico de la toma de decisión.
No obstante, muchos autores defienden que la frecuencia léxica tiene una influencia real y
automática en el reconocimiento de las palabras, y que surge en tareas que no requieren ningún
tipo de decisión.
Por otra parte, el efecto de la frecuencia léxica podría quedar subsumido u oscurecido en
las tareas de categorización semántica, en las que los tiempos son mucho más largos e influyen
poderosamente otras variables, en particular la tipicidad de cada ejemplar dentro de una
categoría.
Sin embargo, es difícil aislar el efecto de esta variable del de otras con las que normalmente
guarda relación en el vocabulario de un idioma.
La variable frecuencia léxica tiende a relacionarse con otras variables, como el grado de
concreción, el número de significados, la longitud de la palabra, etc.
❖ La edad de adquisición es una variable determinante, más importante incluso que la
frecuencia de uso, no obstante, los estudios actuales tienen en cuenta ambas variables, así en
tareas de decisión léxica el efecto de la frecuencia es mayor mientras que en categorización
semántica la edad de adquisición es más influente.
Las palabras que los niños aprenden antes son las de mayor frecuencia. No obstante, en qué
momento aprenden por lo general los niños cada palabra es realmente complicado. La  medida
objetiva más aceptada fue la de Morrison, Chappell y Ellis, consistente en presentar dibujos de
objetos a niños de diferentes edades para que los nombraran. En cada dibujo se va probando en
distintas edades y se toma como punto de corte cuando una mayoría de cierta edad es capaz de
nombrar el dibujo. Para las palabras abstractas que son imposibles de representar mediante
fotografías o dibujos se emplean las escalas subjetivas de edad de adquisición, que guardan una
correlación muy alta con los resultados obtenidos presentando dibujos a los niños, y que se
obtienen presentando una lista de palabras a adultos para que puntuen sobre una escala
(generalmente de 1 a 7) la edad a la que creen que aprendieron cada palabra.
❖ Lexicalidad. En la tarea de decisión léxica, el tiempo necesario para decidir que un estímulo
es una palabra suele ser más corto que el que se requiere para decidir que no es una palabra,
siempre y cuando estímulos no-palabras se ajusten a las normas ortográficas y fonológicas del
idioma, es decir, que sean pronunciables y presenten secuencias admitidas en la lengua, como
nizo, pecil, etc. (Pseudopalabras). Cuando esto no se cumple, los tiempos de rechazo son muy
cortos.
❖ Vecindad fonológica. Se consideran vecinos fonológicos de una palabra todas aquellas que
comparten todos los fonemas, excepto uno, y en las mismas posiciones. Así, las palabras topo,
tuno y toro son vecinas de tono.
Hay palabras con muchos vecinos, y palabras ermitañas, que no tienen vecinos, como tifus. La
mayoría de los estudios encuentran que la vecindad fonológica tienen efectos inhibitorios en el
reconocimiento de palabras habladas, ya que, cuantos más vecinos tiene una palabra, más se
tarda en reconocerla (mayor es el número de competidores que hay que inhibir para lograr su
reconocimiento). Además, si se trata de vecinos de alta frecuencia es más difícil su inhibición.
Cuando una palabra tiene muchos vecinos y, además, éstos son de alta frecuencia, sus tiempos de
reconocimiento son mucho mayores que cuando tiene pocos vecinos y éstos son de baja
frecuencia.
Efecto del contexto (priming). En los experimentos típicos de priming se presenta un punto de
fijación durante 500 o 1.000 ms, después se presenta el prime durante un tiempo muy breve, en
torno a los 250-500 ms y un momento después se escucha el target que los sujetos tienen que
responder. La separación entre el prime y el target se denomina stimulus onset asynchrony (SOA).
Los efectos del priming se calculan siempre comparando los tiempos de reconocimiento de la
palabra target cuando va precedida del prime (mesa-silla) respecto a si va precedida de una
palabra no relacionada (coche-silla). Dichos efectos pueden ser facilitadores, si disminuyen los
tiempos de reconocimiento, o inhibidores si los aumentan, dependiendo del SOA y del tipo de
relación entre prime y target (priming semántico, fonológico, de repetición, sintáctico, afectivo).
El fenómeno del priming afecta sólo a las palabras reales, no a las no-palabras, indicando que se
trata de un efecto lingüístico, y no puramente perceptivo.
❖ La Imaginabilidad se refiere a la facilidad con que uno puede imaginar el significado de una
palabra. Las palabras concretas y altamente imaginables se recuerdan mejor en las pruebas de
memoria. La variable imaginabilidad al ser cuantificada mediante escalas subjetivas, en los que los
participantes tienen que puntuar sobre una escala, entre los valores 1 y 7 (fácil de imaginar-
difíciles de imaginar), que puede ser afectada por otras variables relacionadas. Sin embargo, en
numerosos estudios, a través de análisis estadísticos, se ha puesto de manifiesto la influencia
independiente de la imaginabilidad.
❖ La Polisemia es el número de significados que tiene una palabra. Los resultados indican que
las palabras que tienen mayor número de significados se reconocen más rápido que las que tienen
pocos significados, especialmente cuando se trata de palabras de baja frecuencia. Además, los
significados de las palabras polisémicas tienen cierto parentesco semántico. Por el contrario,
las palabras homógrafastienen también varios significados, pero sin la menor relación entre ellos
(por ejemplo la palabra banco).
❖ Morfología. Se han propuesto dos hipótesis alternativas sobre el reconocimiento de las
palabras morfológicamente complejas:

 La Hipótesis del listado exhaustivo sostiene que cada palabra compuesta tiene su propia
representación léxica independiente. La frecuencia de cada palabra es la que determina
los tiempos de reconocimiento.
 La Hipótesis de la segmentación obligatoria mantiene que las palabras son segmentadas
en sus morfemas componentes, por lo que se accede a la raíz y a los afijos de manera
independiente, de forma que, lo que determina el reconocimiento es la frecuencia de la
raíz y de los afijos correspondientes.

➔ Modelo mixto o dual asume ambas posibilidades de procesamiento. Las palabras de


morfología irregular y las palabras frecuentes cuentan con su propia representación léxica,
reconociéndose directamente, mientras que las palabras regulares y de baja frecuencia se
descomponen en raíz y afijos.
❖ Contenido emocional. Los tiempos de reacción son más rápidos para las palabras con alta
carga en determinadas dimensiones emocionales. Así, las palabras tabú se recuerdan mejor en
pruebas de memoria, deteriorando el recuerdo de la palabra precedente y posterior dentro de una
lista.

6.4. Modelos de reconocimiento de palabras

Un modelo pretende ser una construcción teórica que representa cierta realidad de difícil
manejo u observación directa con cierta visión unificadora y de carácter predictivo.
Además, un modelo sigue el principio de falsabilidad, es decir, debe ser refutable por los datos.
Según Popper, cada buena teoría científica es realmente una prohibición, así, cuantas más
prohibiciones mejor será la teoría y más específicas serán sus predicciones.
Muchos modelos científicos se basan en una analogía como sucede con el modelo de
Maxwell cuando el autor concibió las fuerzas electromagnéticas como análogas a los fluidos.
Actualmente, muchos autores apuntan hacia la analogía del propio cerebro.
En el campo específico de la psicolingüística, la analogía del diccionario mental ha tenido gran
influencia.
De esta forma, los modelos del acceso léxico se dividen fundamentalmente entre los que
defienden un acceso directo al léxico mental y los que consideran la existencia de algún tipo
de mecanismo de búsqueda serial.

Modelo cohorte

En los años setenta y siguientes, John Morton planteó un modelo sobre el reconocimiento de las


palabras en el que cada palabra estaría representada en la memoria por un dispositivo
denominado logogén.
El logogén es un mecanismo que acumula evidencia o activación respecto a una palabra. Así, los
logogenes compiten entre sí en la identificación de las palabras y, mientras no están activos,
mantienen un cierto nivel de activación basal o de reposo. Se trata de un modelo de acceso
directo porque la búsqueda léxica no ocurre de forma serial, sino que desde el principio toda la
información es accesible al sistema completo de logogenes y éstos reciben activación en paralelo.
Al sistema de logogenes llega información en paralelo desde tres fuentes distintas:

1. representaciones ortográficas obtenidas por el análisis visual de las palabras escritas,


2. representaciones auditivas de las palabras habladas, y
3. representaciones semánticas procedentes del sistema cognitivo.

No obstante, el sistema de logogenes no hace distinción entre las fuentes, y para él las tres son
externas.
De este modo, Morton explica el efecto del contexto, en la medida en que los logogenes
disponen de mayor información procedente del sistema cognitivo, necesitará menos información
sobre el estímulo (de abajo-arriba) para la identificación de las palabras.
Este modelo interactivo explica la mayor parte de los fenómenos empíricos conocidos en el
momento de su formulación:

 Priming de repetición. Después de que un logogén ha sido activado al identificar una


palabra, su activación desciende al nivel de reposo, pero esto no ocurre de forma
instantánea, sino que lleva cierto tiempo. Las palabras recién activadas retendrán una
activación residual superior a la de reposo durante un corto período de tiempo.
 Efecto de la frecuencia léxica. Cada logogén tiene un umbral de disparo distinto. Las
palabras de alta frecuencia, que son familiares al sistema de logogenes porque se han
presentado muchas veces a lo largo de la vida del sujeto, cuentan con logogenes con un
umbral más bajo, activándose antes que las palabras poco frecuentes, que tienen
umbrales más altos y necesitan mayor cantidad de activación antes de alcanzarlo.
 Efecto del priming semántico. Los logogenes están conectados entre sí de manera que se
comunican la activación, y ésta se extiende entre los logogenes cercanos.

Por otra parte, Coltheart, Davelaar, Jonasson y Besner, sugirieron la existencia de un tiempo


límite para reconocer las palabras en el sistema de logogenes. Una vez agotado este plazo sin que
se haya disparado ningún logogén, se rechaza el estímulo como no-palabra.
De esta forma, si éste guarda cierto parecido superficial con algunas palabras, se tardará más en
el rechazo porque habrá activación parcial de sus logogenes.
Sin embargo, el modelo opera únicamente con unidades léxicas, por lo que no está claro cómo
se procesan las unidades subléxicas, como las sílabas y otras.
Además, el modelo predice que debería existir una facilitación clara entre modalidades
sensoriales distintas, o priming transmodal de repetición, que no es confirmada por los datos.
Winnick y Daniel demostraron que la lectura en voz alta de una palabra facilitaba su
reconocimiento taquistoscópico posterior, pero nombrar una palabra ante un dibujo, o producirla
en respuesta a una definición, no influía.
Por esta razón, plantearon una nueva versión del modelo, considerando ahora tres
sistemas distintos de logogenes, uno por cada modalidad sensorial o canal de entrada (visual
frente a auditiva), más un tercer sistema de salida.
De este modo, los sistemas se mantienen separados sin influencias entre modalidades.
Más tarde, la evidencia experimental posterior sugirió la necesidad de considerar cuatro
sistemas: uno para leer, otro para escribir, otro para escuchar y otro para hablar.

Modelo de Forster

Los modelos de búsqueda serial conciben mecanismos semejantes al de identificar una palabra


en un diccionario convencional. El modelo de Forster plantea una búsqueda en dos etapas; la
primera se llevaría a cabo a través de ficheros de acceso (específicos de una modalidad de
información; ortográfica, acústica, fonológica, sintáctica y semántica), y la segunda en un
gran archivo maestro o principal.
De esta forma, cuando una palabra se presenta visual o auditivamente, el estímulo de entrada es
convertido en una representación perceptiva y enviada al archivo de acceso apropiado para su
análisis.
Los ficheros de acceso están divididos en compartimentos ( bins ) separados, donde los ítems
están ordenados por la frecuencia de uso, con las unidades más frecuentes al principio, explicando
así el efecto de la frecuencia de las palabras en la velocidad de reconocimiento.
Se trata de un modelo de tipo modular porque la información de los niveles lingüísticos
superiores(oracional y supraoracional) no incide directamente en el proceso de acceso o
localización de las palabras y el único efecto de contexto que puede darse es a través de las
referencias cruzadas dentro del fichero maestro, explicando así el priming semántico.
El priming de repetición ocurre porque puede haber un cambio temporal en el orden de los
ítems dentro de cada bin, debido a su uso. Las no-palabras se rechazan una vez que ha habido una
búsqueda exhaustiva en el bin correspondiente.
Una versión más reciente asume diferentes niveles de actividad para las entradas en los ficheros
de acceso, para explicar el priming basado en las similitudes ortográficas entre los estímulos.
En los últimos años, Forster ha incorporado un rasgo de paralelismo sugiriendo que, dentro de
cada fichero de acceso, se produce una búsqueda simultánea en todos sus bins.
Otro modelo de búsqueda serial que intentan superar algunas de sus limitaciones es el modelo
de verificación de Becker, que pretende dar una explicación más sofisticada del priming semántico
y del diccionario de bolsillo, planteando que existen dos diccionarios mentales: uno que contiene
información de todas las palabras, y otro que contiene información sólo de las palabras muy
comunes, de alta frecuencia, a modo de una especie de diccionario de bolsillo.

Modelo de cohorte

El modelo de Marslen-Wilson supone una solución mixta entre los modelos de acceso directo y
los de búsqueda serial, que postula una secuencia ordenada de etapas que se activan paralela y
simultáneamente varios elementos léxicos.
Se trata de un modelo concebido únicamente para las palabras habladas que plantea que
mientras una persona está escuchando una palabra, desde el principio se activan en paralelo un
conjunto finito, o «cohorte», de palabras congruentes con los sonidos iniciales, y todas ellas serían
inicialmente candidatos léxicos del estímulo.
Wilson empleó la técnica experimental del sombreado (shadowing) de frases y otros estímulos
lingüísticos observando que la percepción de una palabra se basa en un continuo estrechamiento
del abanico de candidatos posibles hasta alcanzar el punto de unicidad, momento en que se
produciría la identificación léxica.
Sin embargo, este modelo tiene una serie de inconvenientes y es que compartir la posición
inicial de las palabras no es una condición indispensable para que se activen los competidores.
Además, no explica bien el efecto de la frecuencia léxica como por qué se identifica antes la
palabra más frecuente que la menos frecuente.

Modelo TRACE

McClelland y Elman proponen un modelo altamente interactivo para el reconocimiento de las


palabras habladas, derivado de un modelo anterior sobre las palabras escritas, formado por
múltiples unidades simples conectadas entre sí.
Estas unidades están organizadas en tres niveles de procesamiento:

1. Unidades de entrada (analizar el input o estímulo entrante, en sus rasgos fonológicos


elementales, como sonidos sordos, sonoros).
2. Fonemas
3. Palabras

La información fluye desde abajo hacia arriba, pero, al mismo tiempo, los niveles superiores
influyen sobre los inferiores, facilitándoles la tarea (Procesamiento top-down). Dentro de cada
nivel, las unidades que lo componen están conectadas lateralmente entre sí por conexiones
inhibidoras, mientras que por el contrario, las conexiones entre niveles distintos
son excitatorias y bidireccionales.
Este modelo puede ser implementado matemáticamente en computadores para llevar a cabo
simulaciones. El modelo explica bastante bien los efectos del contexto léxico y fenómenos
asociados, como la restauración fonémica y la coarticulación, localizando apropiadamente los
límites entre las palabras dentro de una cadena hablada y funciona correctamente con estímulos
ruidosos, semejantes a los que se dan en condiciones naturales.
No obstante, uno de sus inconvenientes reside en su propia flexibilidad, además, la manera en
que trata el tiempo en el estímulo de entrada, segmentando en cortes iguales, no es muy realista.

6.5. Bases neurológicas del reconocimiento oral de palabras

La primera hipótesis planteaba que el lenguaje oral se percibía mediante la corteza auditiva, ya
que los pacientes que presentaban dificultades graves de comprensión sufrían lesiones en la
circunvolución temporal superior del hemisferio izquierdo (Afasia de Wernicke).
No obstante, algunos trastornos en la capacidad de procesar sonidos del lenguaje o fonemas
guardan poca relación con las dificultades de compresión observadas en la afasia de Wernicke,
mientras que la destrucción de la circunvolución temporal superior izquierda puede coexistir con
una comprensión normal y, por el contrario, con problemas en la producción oral. Además,
la circunvolución transversal de Heschl (área auditiva primaria) interviene directamente en el
primer procesamiento de toda clase de sonidos, sean lingüísticos o no.
Hickok y Poeppel plantean que la entrada sensorial auditiva es procesada a través de dos
grandes sistemas o rutas neurales (streams).

Ruta ventral

La ruta ventral procesa la señal de habla para su comprensión. Se considera que la ruta ventral
es bilateral, aunque con importantes diferencias computacionales entre ambos hemisferios
cerebrales (Ruta del qué). Así, si se trata de una señal de habla, y dependiendo del tipo de tarea
ejecutada, la información neural se bifurca en los dos grandes sistemas mencionados.
Según Hickok y Poeppel, no está claro aún, si la computación del habla implica obligatoriamente
todos los niveles de procesamiento operando de forma serial y jerárquica o, por el contrario,
actúan en paralelo y con cierto grado de flexibilidad.
Dentro del sistema ventral se dan ciertas diferencias computacionales entre los dos hemisferios
que afectan sobre todo a la escala temporal de integración.
El hemisferio derecho mostraría selectividad para actuar en una escala amplia de 150-300 ms,
propia de la información suprasegmental (prosodia o entonación) del habla.
El hemisferio izquierdo, por el contrario, parece menos selectivo y podría actuar tanto en esa
escala de integración, como en una escala más corta de 20-50 ms, en lo que sería un
procesamiento rápido propio del nivel segmental.
Ruta dorsal

La ruta dorsal proyecta dicha información sobre las redes articulatorias del lóbulo frontal
izquierdo, fuertemente lateralizada en el hemisferio izquierdo dominante.
Esta ruta neural corresponde a las redes articulatorias y tendría un papel esencial en la
integración auditivomotora.
Hickok y Poeppel sugieren que existen al menos dos niveles de interacción auditivomotora,
uno estrecho que implicaría segmentos fonéticos, y otro, más amplio, que abarcaría secuencias de
segmentos y que intervendría principalmente en la adquisición de nuevo vocabulario. Así, en la
medida en que las palabras se hacen más familiares en su uso, este último nivel de integración se
volvería más automático, agrupando secuencias motoras más amplias.
Las lesiones unilaterales en el sistema dorsal causan con frecuencia dificultades en la producción
del habla, como sucede con la afasia de conducción, en la que el daño se localiza preferentemente
en la unión temporoparietal o en las fibras del fascículo arqueado, que forma parte de la ruta
dorsal.
Este síndrome de desconexión se caracteriza por una buena comprensión oral, ya que la ruta
ventral está intacta o, si no lo está, queda compensada por la del hemisferio derecho, pero
presenta frecuentes errores fonémicos en la producción verbal, siendo sensibles a la carga de
procesamiento. así los errores son más probables cuando se pronuncian palabras más largas,
palabras menos frecuentes y con menos restricciones semánticas debidas al contexto.
De esta forma, el concepto básico de que la información sensorial debe ser procesada por dos
sistemas diferenciados, uno conceptual o del significado, y otro articulatorio-motor, se ajusta bien
a un marco dualtambién planteado para el dominio visual y más recientemente para el
somatosensorial.

Оценить