Академический Документы
Профессиональный Документы
Культура Документы
6. RESUMEN Hemos visto q las fases tienen un alto grado de org serial, pero tb en cada una de las fases hay un alto grado
de interacción en paralelo de carácter intramodular, en las primeras fases, e intermodular en las últimas. A medida q el
procesamiento del color se hace más complejo, mayor es la intervención de todo el conocimiento a disposición del sistema
visual para precisar la inf que necesita el organismo.
T.3 PROCESAMIENTO VISUAL INICIAL
La percepción de la forma es central pq la forma el determinante principal del reconocimiento visual de los objetos.
3 aportaciones: (la 1ª) invest fisiológica del sistema visual, la invest psicofísica y la teoría computacional de la visión (la
última). Aunq no sean teorías completas de la percepción de la forma, son determinantes del modo de entenderla pq cada
una plantea un punto de partida diferente xa entender los 1ºs pasos del proces q son la base sobre la q construir los demás.
1. LAS INVESTIGACIONES DE HUBEL Y WIESEL
Kuffler descubrió la org de los campos receptivos de las células ganglionares en términos oponentes entre el centro y el
contorno. En el cap anterior estudiamos el func de este tipo de células. Hubel y Wiesel trataron de extender la invest de los
campos receptivos a las células de la corteza estriada y encontraron diferentes clases de células q tenían difs tipos de
campos receptivos. Clasificaron estas células en 3 clases con el nombre de células simples, complejas e hipercomplejas.
1.1 Tipos de células
- células simples: tienen campos receptivos con una forma más complicada q las ganglionares o las del núcleo geniculado
del tálamo cuyos campos receptivos son circulares. Pero continúa teniendo la estructura antagónica centro-contorno en la q
tanto uno como otro puede ser excitador (on) o inhibidor (off). Un punto de luz proyectado sobre una zona excitadora (on)
es un E suficiente para aumentar la tasa de disparo de una célula y un punto de luz proyectado sobre una zona inhibidora
(off) disminuye la tasa de disparo. Cuando los Es son mayores q un punto de luz la respuesta de la célula aumenta de forma
lineal a medida q aumenta la cantidad de luz que cae sobre una zona excitadora o dism a medida q aumenta la cantidad de
luz q cae sobre una zona inhibidora. Esta naturaleza lineal de la respuesta es una de las caracs principales de las simples.
El estímulo óptimo para una célula simple es aquel que mejor se ajusta a la forma de su campo receptivo y la geometría de
los campos receptivos da lugar a diferentes tipos de células simples. La mayor parte tienen campos receptivos alargados y
responden preferentemente a líneas o bordes de una det orientación y posición en la retina.
- Unas tienen un área excitadora en un lado y otra área inhibidora en el otro lado por lo que responden preferentemente a
bordes de luminancia formados por la transición de luz a oscuridad; por ello se les llama a veces detectores de bordes.
- Otras tienen campos receptivos con una zona central alargada, que puede ser excitadora o inhibidora, flanqueada a uno y
otro lado por zonas antagónicas. Estas células responden preferentemente a líneas claras u oscuras de una det orientación y
posición en la retina y son a veces llamadas detectores de líneas o detectores de barras. En general las distintas formas de
campos receptivos q se han encontrado son pocas y responden a tipos diferentes de bordes, líneas o barras. Pero para cada
una de estas formas se ha encontrado una gran cantidad de células cada una de las cuales responde a una orientación y
posición retiniana particular pero q en conjunto cubren con sus respuestas todas las orientaciones posibles en el campo
visual. El tamaño de los campos receptivos de las simples depende de su posición en la retina con rel a la fóvea. En la zona
de la fóvea los campos receptivos son más pequeños q en la periferia.
Aún no se sabe cómo las células simples se relacionan con las ganglionares y con las de los núcleos geniculados del tálamo
cuyos campos receptivos son circulares. Hubel propuso un modelo sencillo como el de la Fig 3.1.
La fig ilustra las conexiones entre 4 células con campos receptivos circulares y una célula
simple. Cada una de las 4 células que conectan con la simple tiene un campo receptivo de centro
on y contorno off y los centros de estas cuatro células se encuentran dispuestos a lo largo de una
línea. Si suponemos q muchas células como estas 4 se estan conectadas a una simple, podemos
entender que el campo receptivo de la célula simple consistirá en una región excitadora estrecha
y alargada q estará flanqueada por una región inhibidora y que un estímulo luminoso semejante a
una línea será capaz de activar a su máximo nivel a esa célula simple. El modelo de la Fig 3.1 es
solo un modelo hipotético, más adelante veremos q hay otras formas de interpretar el func de las células «simples».
- Las células complejas: las 1ªs descubiertas x Hubel y Wiesel, las más abundantes en la corteza visual estriada; el 75% de
esta corteza está formada por células complejas. Comparten con las simples la cualidad de responder solo a líneas q tienen
una orientación específica. Diferencias respecto a las simples:
l. Tienen campos receptivos algo más grandes que las células simples.
2. No responden de forma específica a la posición de una línea dentro del campo receptivo. Con tal que se mantenga la
orientación de la línea, cualquier posición dentro del campo receptivo es capaz de provocar la excitación de estas células.
3. Son muy sensibles al movimiento de las líneas que sirven de estímulo.
No responden si son estimuladas encendiendo o apagando pequeños puntos de luz estacionarios. Incluso las líneas
estacionarias producen una respuesta débil y no mantenida. Pero si una línea orientada adecuadamente se mueve a lo largo
del campo receptivo, su respuesta es máxima y se mantiene desde q el E entra en el campo visual hasta q lo abandona.
4. Así, la R de las complejas no es lineal respecto a la cantidad de luz recibida, al contrario q la respuesta de las simples.
Fig 3.2 hipotético modelo de las rels entre las células simples y las complejas propuesto por Hubel. Representa una célula
compleja q recibe inf de 3 simples aunq habría q suponer q son muchas más las simples q convergen en una compleja. Los
campos receptivos de las simples tienen todos la misma orientación pero están distribuidos de forma q se solapan sobre la
totalidad del campo receptivo de la compleja.
La célula compleja se activará siempre que su campo receptivo sea estimulado por una línea con la orientación apropiada,
pero la excitación de la célula será breve si la estimulación es estática, pero si el E se mueve a lo largo del campo receptivo
de compleja, un nº mayor de simples disparará sucesivamente, evitando el problema de la adaptación de las simples y
manteniendo de esta forma la excitación sostenida de la célula compleja.
Aunq existe un pequeño porcentaje de las mismas, entre un 10 y un 20% en las láminas superficiales de la corteza estriada,
q muestran selectividad a la dirección del movimiento de forma q tienden a disparar preferentemente cuando el mov del
estímulo va en una det dirección y no disparan o lo hacen menos intensamente cuando el mov es en dirección contraria.
- células hipercomplejas: campo receptivo más selectivo q las complejas. Carac fund: disminución de su R cuando la
longitud de la línea q la estimula aumenta por encima de un límite. Esto es sorprendente pq tanto las simples como las
complejas muestran un aumento en la R cuando aumenta la longitud de la línea q se usa como E. Es como si las nuevas
células respondieran preferentemente a líneas q presentan una terminación. Hoy se llaman células con inhibición final pq
responder a líneas con terminación no está sólo asociada a células q presentan caracs complejas sino tb a células simples.
Es decir, hoy se piensa q las células hipercomplejas son grupos particulares tanto de células simples como complejas q
tienen una sensibilidad gradual a la presencia de una terminación.
1.2 La arquitectura de la corteza estriada Tanto las invests de Hubel y Wiesel, como posteriores, principios de su org:
1) org retinotópica. La corteza estriada preserva la topografía propia de la retina en el sentido de que áreas que son
adyacentes en la retina proyectan sobre áreas en la corteza que también son adyacentes. La representación de la distancia
entre las líneas radiales tiende a igualarse en la autorradiografía a pesar de que en el estímulo la distancia entre las líneas es
muy diferente. Esta diferencia entre las rels métricas de la representación en la corteza y en el estímulo se conoce como
magnificación cortical y es una distorsión característica de la representación retinotópica de la corteza estriada debida a q
la zona central de la retina ocupa un área más amplia en la corteza q la zona periférica. Esta distorsión es una consecuencia
de la mayor densidad de receptores existente en el centro de la retina en comparación con la periferia. El análisis q la
corteza visual realiza en el centro de la retina que es más detallado que en la periferia.
2) columnas de dominio ocular. una de las 1ªs caracs de su arquitectura q fue descubierta. Si se introduce un electrodo en
la corteza estriada de forma perpendicular a su superficie, puede comprobarse q todas las células a lo largo de esa
trayectoria responden de forma preferente a la estimulación presentada a un det ojo y no lo hacen, o en menor medida, a la
presentada al otro ojo. Si el electrodo se introduce de forma oblicua a la superficie, tan en paralelo a la misma como sea
posible, el predominio de un ojo sobre el otro en la excitación de las células alterna. Primero predomina un ojo y luego otro
y la secuencia alternante se repite a lo largo de la trayectoria. Estos resultados obtenidos con técnicas de registro unicelular,
ponen de manifiesto una org de la corteza en columnas, cada una de ellas formada por conjuntos de células que responden
a un ojo con preferencia al otro y todas ellas organizadas de forma alternante respecto al ojo dominante. Fig 3.4 esquema
de un corte realizado tangentemente a la superficie del área V1 de un mono. El corte muestra la org alternante de columnas
claras y oscuras correspondientes al ojo derecho e izquierdo respectivamente. En general, el tipo de transición brusca q se
produce de las zonas claras a las oscuras es propio de la capa 4C de la corteza, en el resto de las capas la alternancia de
columnas de dominio ocular es más suave y gradual pasando de columnas con clara preferencia por un ojo a otras en que la
preferencia es menor y a otras claramente binoculares antes de llegar a las columnas con preferencia por el otro ojo.
3) columnas de orientación. la forma en que se organiza esa preferencia a la orientación (carac tanto de las simples como
de las complejas) tiene tb una curiosa regularidad. Al igual q la preferencia ocular, la preferencia por una det orientación
permanece constante si la penetración del electrodo de registro es perpendicular a la superficie de la corteza. Todas las
capas de la corteza desde la superficie hasta la sustancia blanca muestran preferencia por una det orientación excepto la
capa 4 q no muestra preferencia. Si la penetración del electrodo se hace de forma paralela a la superficie, aparece una
secuencia regular de cambios en la preferencia por la orientación de forma que cada vez que el electrodo avanza unas 50
micras se produce un cambio en la preferencia por la orientación de unos 10 grados de ángulo bien en el sentido de las
agujas del reloj bien en sentido contrario. Esta distribución del cambio hace q en un espacio de aprox un milímetro el
cambio de preferencia en la orientación sea de unos 180 grados.
1.2.4. org modular. Hubel y Wiesel propusieron una org funcional de la corteza estriada q resumía las preferencias
oculares y de orientación. Según Hubel las 6 capas de la corteza están organizadas en módulos o hipercolumnas que se
distribuyen de forma perpendicular a la superficie. Las dims de los módulos varían de una capa a otra, pero la org
funcional es la misma. Fig 3.5: idealización de la org que caracteriza a cada módulo. Como se ve, la org del módulo
resume la estructura de columnas q hemos comentado en 2 y 3. Por un lado el conjunto de
columnas alternantes de dominio ocular I D I D... organizan la inf del ojo izquierdo y
derecho respectivamente. Por el otro, se muestra la org de las columnas de orientación
especificando los cambios en orientación a los q las distintas columnas son sensibles.
Estas unidades funcionales son el mosaico fund q organiza la corteza estriada.
Las invests de Hubel y Wiesel demostraron tb q la org de la corteza visual estriada no sólo depende de fs de herencia sino
tb de fs reldos con el medio. Estudiando la conducta de las células de la corteza estriada de gatos pequeños en condiciones
normales y de privación visual comprobaron que, si bien hay células q responden selectivamente a la orientación en los
recién nacidos, hay tb periodos críticos en las primeras semanas de maduración durante los cuales es necesaria la
estimulación ambiental para lograr un desarrollo normal en el func de las células de la corteza estriada.
El periodo crítico no es el mismo xa todas las propiedades de la estimulación visual q son procesadas x la corteza estriada.
Está reldo con el nivel q ocupan las células en el sistema visual y tiene lugar antes para las células q ocupan un nivel más
bajo, ya q su maduración es un requisito necesario para el desarrollo de células que operan a un nivel más alto. El periodo
crítico de la sensibilidad a la orientación oscila entre la 1ª y la 5ª semana de vida.
El periodo crítico para el dominio ocular entre la 5ª y la 10ª semana de vida.
Los trabajos de Hubel y Wiesel son una de las principales aportaciones al estudio de la percepción visual en el sXX. Su
influencia fue enorme ya que sus descubrimientos parecían apoyar a las teorías basadas en detectores de características.
2. APROXIMACIÓN PSICOFÍSICA
2.1 El análisis de la frecuencia espacial Para Hubel y Wiesel lo q hacen las células de la corteza estriada es responder de
forma selectiva a caracs estimulares simples como la orientación y el movimiento de líneas y bordes. Estas células son
detectores de características. A 1ª vista esta interpretación parece la más simple y ligada a los hechos experimentales.
Pero tiene estas dificultades:
- es verdad q una línea luminosa puede aparecer como el mejor E para una det célula, pero no se puede descartar q otros Es
posibles puedan estimularla tb. Ningún experimento puede agotar el conjunto de Es eficaces posibles para una célula.
- suponer que el análisis más elemental del patrón estimular que realiza el cerebro lo hace en términos de líneas y bordes
requeriría una teoría capaz de mostrar que todo el conjunto de formas y objetos q podemos percibir se puede descomponer
en términos de líneas y bordes. No es negar la existencia de células q responden preferentemente a líneas de una det
orientación; esto es un hecho experimental; sino preguntarse si esa respuesta es el nivel más elemental de análisis.
La teoría de la frecuencia espacial surgió como una alternativa a la teoría de los detectores de características:
- Sostiene q el análisis más elemental de los objetos q realiza el sistema visual es en términos de cs de frecuencia espacial.
- El patrón estimular debe ser considerado como una onda compleja de intensidad luminosa q es analizada por el cerebro
en términos de sus cs elementales de frecuencia espacial. Las células de la corteza estriada llevan a cabo ese análisis de cs
pq actúan como filtros espaciales q responden selectivamente a una det banda de frecuencias espaciales con preferencia a
otras frecuencias.
2.2. El concepto de frecuencia espacial Por muy compleja que sea una onda, siempre se puede analizar en sus cs simples
llamados ondas sinusoidales. Fig 3.6. A: onda sinusoidal referida al dominio
del espacio. En B aparece el E correspondiente a la onda sinusoidal. El eje
horizontal de la onda representa el espacio estimular cuyos cambios en
intensidad están representados en el eje vertical. El E varía en intensidad a lo
largo de la dim horizontal con oscilaciones suaves de zonas claras y oscuras
de igual amplitud que se repiten en intervalos iguales. Este E se llama
enrejado y el de la Fig 3.6 es un enrejado sinusoidal en el q las transiciones
entre las zonas claras y las oscuras son suaves y continuas. Cuando estas
transiciones son bruscas (fig 3.7) el enrejado se llama onda cuadrada. Igual
q las ondas sinusoidales son los els más simples q podemos analizar una onda, los enrejados sinusoidales son los Es más
simples xa estudiar la sensibilidad del S visual a la frecuencia espacial. Todo enrejado sinusoidal 4 parámetros: la
frecuencia, amplitud y fase de las ondas sinusoidales q lo caracterizan y la orientación del patrón respecto a la vertical.
1. La frecuencia espacial de un enrejado viene dada por la anchura de las
zonas claras y oscuras que lo componen. Un enrejado en el que las zonas
claras y oscuras son anchas tendrá menor frecuencia espacial q un enrejado
en el q las zonas son estrechas ya q el nº de ciclos por unidad de distancia
en la onda asociada al enrejado será mayor en el 2º caso. La unidad de
distancia q se usa es el grado de ángulo visual.
El concepto de ángulo visual es sencillo y nos permite relacionar todas las
medidas con el observador. En la Fig 3.8 puede verse q una flecha (h)
colocada cerca del observador (o) produce una imagen retiniana mayor que
otra flecha (h') q está más alejada. Si para cada flecha trazamos dos líneas
q intercepten sus dos extremos y converjan en el ojo del observador,
tendremos dos ángulos visuales alfal y alfa2 tales q alfa1 es mayor que
alfa2. Los ángulos, por tanto, están directamente reldos con el tamaño de la
imagen retiniana y éste, a su vez, está directamente reldo con el tamaño del
E e inversamente reldo con la distancia a la q el E se encuentra. En el caso
de la frecuencia espacial se usa el nº de ciclos por grado de ángulo visual (c/gav), porque nos indica directamente las caracs
espaciales del E q llega al observador independientemente del tamaño del E o de la distancia a la que esté.
2. La amplitud de onda de un enrejado es la mayor o menor intensidad luminosa de sus zonas claras u oscuras. Un
concepto importante derivado de la amplitud es el de contraste: la diferencia entre zonas claras y zonas oscuras y q se
define así: Contraste = (Imax - Imin) / (Imax + Imin)
Donde Imax es el punto de máxima intensidad e Imin el punto de mínima intensidad luminosa en el enrejado. Se puede ver
claramente que el contraste será cero cuando lmax sea igual a Imin y será igual a 1 cuando Imin sea cero. Por tanto, el
índice de contraste oscila entre 0 - cuando no hay diferencias de intensidad luminosa y tenemos un campo uniforme de luz-
y 1, cuando la diferencia entre las zonas sea máxima.
3. La fase de un enrejado se refiere a la posición de la oscilación de la onda sinusoidal en un momento det que sirve de
punto de referencia. La fase se mide en grados en relación con ese punto de referencia. La onda sinusoidal de la Fig 3.6 en
el punto en que comienza está en fase de 0°, también llamada fase seno porque es el punto de comienzo de la inflexión en
sentido positivo. Si la onda comenzara en el punto de su máximo valor positivo de amplitud se diría que está en fase de
90°, también llamada fase coseno. Si comenzara en el punto de comienzo de la inflexión en sentido negativo estaría en fase
de 180° (fase antiseno) y si lo hiciera en el punto de mínimo valor de amplitud estaría en fase de 270° (fase anticoseno). La
fase es, por tanto, una medida de posición y puede variar entre Oy 360 grados.
4. La orientación de un enrejado se refiere al grado de desviación de la vertical que presentan sus zonas claras y oscuras.
Se suele expresar en grados a partir de la vertical y en sentido contrario al de las agujas del reloj.
2.3. El análisis de Fourier una de las grandes ventajas de estudiar el patrón de estimulación visual en términos de ondas,
es q la teoría de análisis de ondas está bien establecida en física y podemos usarla para investigar la validez y el alcance de
esta concepción estimular en la percepción visual. En 1822 Fourier propuso su teorema fund sobre las ondas: cualquier
onda, tenga la forma q tenga, se puede expresar de manera única como la superposición (suma) de ondas sinusoidales de
frecuencias y amplitudes definidas. La fig 3.9: aplicación de este teorema al análisis de una onda compleja como es una
onda cuadrada. En la fila F el gráfico de dicha onda. Teóricamente sus cs armónicos son
infinitos en nº, pero en la práctica una onda cuadrada puede aproximarse mediante la
suma de un nº finito de cs. La fila E en la fig muestra cómo la suma de los cs A, B, C y D
produce una onda compleja q se aproxima a la onda cuadrada. La adición de armónicos
de mayor frecuencia aproximaría la onda compleja al ideal representado en F.
Los cs de una onda cuadrada son ondas sinusoidales que guardan entre sí un conjunto de
rels peculiares. El 1r c es el llamado fundamental que consiste en una onda sinusoidal de
igual frecuencia y amplitud que la onda cuadrada. El resto de los cs se llaman armónicos
cuya frecuencia es un múltiplo impar de la frecuencia fundamental y cuya amplitud varía
en función de su orden. Así, el 2º c corresponde al 3r armónico y tiene 3 veces la
frecuencia del fundamental y un tercio de su amplitud, el 3r c corresponde al 5º armónico
y tiene 5 veces la frecuencia del fundamental y un quinto de su amplitud, etc. Así, cada
nuevo armónico q se añade contribuye al total una amplitud cada vez más pequeña, por lo q en la práctica la síntesis de una
onda cuadrada puede aproximarse de forma bastante satisfactoria usando un pequeño conjunto de armónicos aunq en teoría
el nº de cs sinusoidales de una onda cuadrada sea infinito. Fig 3.9: la suma de los 3 primeros armónicos al fundamental da
una buena aprox a la onda cuadrada aunq necesitaríamos añadir más para hacer regulares los puntos máximos y mínimos.
Igual q una onda cuadrada, la onda compleja correspondiente a la imagen de un objeto puede ser analizada en sus cs
fundamentales. Una idea general del papel que los distintos cs de frecuencia espacial juegan en la determinación de una
imagen, puede obtenerse considerando la Fig 3.10 en la q aparece en el centro una fotografía de Einstein. La imagen a la
izquierda muestra la misma pero una vez se han eliminado los cs de frecuencia espacial alta. La imagen de la derecha es
trás haber eliminado los cs correspondientes a las frecuencias espaciales bajas. Como puede comprobarse, los cs de
frecuencia espacial baja dan inf sobre los aspectos globales de la imagen, mientras q los de alta frecuencia de los detalles.
2.4. El análisis de Fourier como modelo así, la imagen de intensidad luminosa que da un patrón de estimulación visual
puede describirse en términos de análisis de ondas y esta forma de entender el E da un proced preciso para su estudio.
Fourier nos da un instrumento de análisis del E útil pero sin una significación psicológica particular. Hay q preguntarse si
el sistema visual tiene filtros diferencialmente sintonizados a un det rango de frecuencias espaciales con preferencia a
otras_ Si éste fuera el caso, cabe pensar q la corteza visual se comporta como un analizador Fourier q, a través del func de
estos filtros, descompone el patrón estimular en sus elementos constituyentes de frecuencia espacial. Vimos cómo 3
receptores q responden diferencialmente a distintas longitudes de onda son suficientes para producir las señales primarias
necesarias para codificar el color. Ahora se trata de asumir la existencia de receptores q responden diferencialmente a
distintas frecuencias espaciales de modo q las frecuencias espaciales altas serían procesadas por canales diferentes a los q
procesan las frecuencias espaciales medias y bajas. La existencia de esos hipotéticos filtros de frecuencia espacial sería un
1r paso para poner la teoría de la percepción de la forma sobre un sólido fundamento. Los defensores de la teoría de la
frecuencia espacial opinan q esos receptores de frecuencia espacial existen y han dado evidencia experimental:
2.5. Evidencia experimental más relevante a favor de la existencia de filtro de frecuencia espacial es psicofísica:
La psicofísica es la parte de la invest psicológica q trata de establecer rels entre las caracs físicas de los Es y la experiencia
consciente usando métodos comportamentales. La carac principal de los métodos conductuales es q analizan la ejecución
del sujeto en tareas muy precisas q permiten hacer inferencias sobre la naturaleza de los procesos que intervienen en la
tarea. Se han usado tareas de detección para medir el umbral de contraste de los sujetos y ha sido el comportamiento del
sistema en sits de umbral el q ha permitido inferir la existencia de diferentes filtros de frecuencia espacial. El umbral de
contraste es el contraste mínimo necesario para distinguir un enrejado sinusoidal de una escena de luminancia homogénea.
Para determinar la cantidad de contraste necesaria para determinar el umbral es frecuente usar el método de ajustes como
método psicofísico. En éste, el sujeto controla el contraste hasta q el enrejado resulta mínimamente perceptible. Cm valor
de contraste correspondiente al umbral suele tomarse el q es capaz de producir un porcentaje de respuesta correctas det.
2.5.1. La Función de Sensibilidad al Contraste (FSC) Si hacemos un experimento psicofísico de medición del umbral de
contraste usando un variado nº de enrejados sinusoidales de diferentes frecuencias espaciales podemos obtener la función
de sensibilidad al contraste de un observador determinado. La sensibilidad al contraste es el valor recíproco del umbral de
contraste ya q la sensibilidad al contraste de una persona será mayor cuanto menor sea el valor de contraste de su umbral.
La función de sensibilidad al contraste es la función q relaciona la sensibilidad al contraste con la frecuencia espacial de los
enrejados utilizados. Fig 3.11: FSC típica de una persona adulta en condiciones de visión fotópica. Como se ve, la función
tiene la forma de U invertida. Todos los puntos en la curva representan la sensibilidad máxima para cada frecuencia
espacial. El punto óptimo de sensibilidad se sitúa entre los 4 y los 5 ciclos por grado de ángulo visual y decae
progresivamente a medida q aumenta la frecuencia espacial, de forma q por encima de aprox los 50 ciclos por grado de
ángulo visual no somos capaces de percibir diferencias entre un enrejado y una superficie de luminancia homogénea.
La función de sensibilidad al contraste permite caracterizar la sensibilidad A de un det sistema visual. Si el experimento de
se hiciera en condiciones de visión escotópica la sensibilidad a todas las frecuencias sería mucho menor pero afectaría más
a las altas que a h las bajas frecuencias porque al faltar la contribución de los conos se perdería b la agudeza visual que
permite percibir los detalles de un objeto.
2.5 .2. Predicciones a partir de la FSC la función de sensibilidad al contrate es un instrumento para poder explorar la
posible existencia de filtros especialmente sintonizados a un det rango de frecuencias espaciales. Campbell y Robson
usaron la FSC de sus sujetos experimentales para comparar su sensibilidad a las ondas cuadradas con su sensibilidad a las
ondas sunusoidales. El fundamento de sus invests consistía en suponer q, si el sistema visual posee filtros sintonizados a
diferentes frecuencias espaciales y realiza un análisis del patrón estimular en términos de cs sinusoidales, entonces la
respuesta correspondiente al umbral de detección de un enrejado de onda cuadrada está det por la respuesta de los filtros a
los distintos cs sinusoidales de la onda cuadrada. Una 1ª predicción de este supuesto es que si comparamos el umbral de
detección de una onda cuadrada de 26 c/gav con el de una onda sinusoidal de la misma frecuencia no debe haber ninguna
diferencia pq en ambos casos el sistema visual está respondiendo únicamente a una onda sinusoidal de 26c/gav. Aunq la
onda cuadrada tiene más cs sinusoidales, el sistema visual no es sensible a los mismos ya q incluso el armónico de menor
frecuencia, que tendrá 78 c/gav, no cae dentro del rango de frecuencias que el sistema visual puede detectar. Por otra parte,
si comparamos el umbral de detección de una onda cuadrada de 2 c/gav con el de una onda sinusoidal de la misma
frecuencia, entonces el umbral para la detección de la onda cuadrada debe ser más bajo, es decir la sensibilidad más alta, q
para la onda sinusoidal porque la onda cuadrada tendrá, además del c fundamental de 2 c/gav, un armónico de 6 c/gav cuyo
umbral de detección es más bajo que el correspondiente al fundamental según la FSC. Así, comprobaron que predicciones
como éstas eran confirmadas por los datos experimentales y concluyeron q el sistema visual está dotado de filtros
sintonizados a rangos dets de frecuencia espacial.
2.5.3. Los posefectos de frecuencia espacial al ver el proces oponente dl color vimos q si miramos una superficie de un
color fundamental, ej rojo, y dp miramos hacia una superficie blanca, veremos la superficie blanca coloreada con el matiz
complementario, el verde. Esto se llama posefecto de color, y tiene lugar pq los receptores q responden al rojo, dbido a la
exposición prolongada al E, pierden sensibilidad y se adaptan (se hacen menos sensibles al E). Así, cuando la mirada se
centra en la luz blanca, los receptores del rojo responden con menor intensidad que los de su oponente, el verde. Los
posefectos, en general, son un fenómeno q da inf sobre la existencia y naturaleza de distinto tipo de receptores. En el
estudio de los filtros espaciales, se ha aplicado tb la lógica de los posefectos xa poder inferir la existencia de múltiples
filtros espaciales. El razonamiento se entenderá mejor con la Fig 3.12: posible rel entre la FSC y un conjunto de hipotéticos
filtros espaciales. Lo importante es q la fig hace patente q si hay múltiples filtros espaciales, la FSC es el resultado de la
actividad d todos ellos. Técnicamente se dice q es la envolvente q encierra y reúne el
comportamiento de muchos más canales cada uno de ellos sintonizado a un rango limitado
de frecuencias espaciales.
Supongamos q sometemos a un sujeto a una exposición prolongada de un enrejado
sinusoidal de una frecuencia espacial particular. Si a continuación comprobamos la
sensibilidad al contraste del sujeto verificando el estado de su FSC y lo comparamos con el
estado de la FSC previo a la adaptación, podemos sacar conclusiones acerca de la
existencia o no de múltiples filtros o canales de frecuencia espacial. Consideremos 1º la
hipótesis de q no existen múltiples filtros sino q la frecuencia espacial se procesa por un
único canal y que la FSC refleja el estado de ese canal. Entonces la adaptación producida
por la exposición prolongada al enrejado afectará a todas las frecuencias espaciales y la
FSC posterior a la adaptación mostrará una menor sensibilidad, es decir un umbral más alto, para todas las frecuencias
espaciales del dominio de la función. Sin embargo, si hay varios canales sintonizados a diferentes frecuencias espaciales, la
adaptación producida por la exposición prolongada afectará únicamente a los receptores sintonizados con esa frecuencia
por lo que la FSC posterior a la adaptación mostrará una menor sensibilidad únicamente para las frecuencias iguales a las
usadas en la fase de adaptación, mostrando una especie de bache en la zona correspondiente a esas frecuencias espaciales.
Blakemore y Campbell confirmaron la aparición de baches de sensibilidad en la zona de las frecuencias utilizadas en la
fase de adaptación de sus experimentos mientras q la sensibilidad para las frecuencias q no habían sufrido adaptación
permanecía sin cambio. Estos datos favorecen la existencia de canales múltiples en el proces de la frecuencia espacial.
2.5.4. Manipulación de la fase de los enrejados otro experimento favorable a la existencia de múltiples canales o filtros
en el procesamiento de la frecuencia espacial ha usado el hecho de q la síntesis de dos
ondas sinusoidales q están en la misma fase produce una onda compleja cuya amplitud
es igual a la suma de las amplitudes de los cs sinusoidales; pero la síntesis de dos ondas
sinusoidales cuyos componentes tienen una diferencia de fase de 180° produce una onda
compleja cuya amplitud es igual a la diferencia de las amplitudes componentes. Fig 3.13
muestra la forma de las ondas de los enrejados usados por Graham y Nachmias. La fila
inferior muestra la forma de las ondas complejas usadas como E. Las dos primeras filas
muestran los cs sinusoidales usados para sintetizar los Es. La amplitud y frecuencia de los cs es la misma para ambos Es.
Lo único q varía de un E a otro es la secuencia de fase de sus cs. El razonamiento de Grahamy Nachmias fue: si el sistema
visual funciona de acuerdo con un modelo de canal único en el q el E se procesa como una totalidad, el E correspondiente
a la onda A será más fácil de detectar q el correspondiente a la onda B ya q el contraste es mayor en A que en B. Pero si el
sistema visual analiza el E respondiendo diferencialmente a sus cs sinusoidales, los dos Es mostrarán el mismo umbral de
detección ya q la amplitud y frecuencia de sus cs es la misma. Resultados: el umbral de detección era igual para los 2 Es.
Existe una gran cantidad de experimentos que muestran de forma convincente la existencia de filtros espaciales. No aún no
se ha podido aislar esos filtros en el nivel fisiológico.
2.6. Función de la corteza visual primaria algunos autores piensan que las células encontradas por Hubel y Wiesel en la
corteza estriada son en realidad filtros espaciales y proponen una interpretación de lo que hacen las células simples y
complejas en términos de análisis de frecuencia espacial en lugar de en términos de detectores de características. Tal es el
caso de Russell y DeValois. En el lab de los DeValois, Albrecht estudió cuidadosamente la respuesta de células simples de
la corteza visual ante una barra estrechablanca y negra. Observó que la respuesta de las células presentaba oscilaciones
adicionales a ambos lados de la respuesta principal a la barra tal como se muestra en la Fig 3.14. Curiosamente este tipo de
R es el q se puede predecir a partir de la R q estas células dan a enrejados de difs
frecuencias espaciales. DeValois encontraron tb campos receptivos de difs tamaños,
unos grandes q responden a una estructura espacial gruesa y otros pequeños que
responden a una estructura espacial fina. Por otra parte existe una correlación entre el
tipo de campo receptivo y el nº d oscilaciones colaterales q presenta la R d las células.
- células con campos receptivos pequeños tienden a presentar mayor nº de
oscilaciones q las de campos receptivos más grandes.
DeValois interpretaron todos estos resultados en el sentido de q la función de al
menos algunas células de la corteza visual es analizar la frecuencia espacial del patrón
estimular. En opinión de los DeValois estas células serían la realización fisiológica de
los filtros espaciales q llevan a cabo un análisis local de las frecuencias espaciales. El
análisis se llama local pq está restringido a los pocos grados de ángulo visual q
registra el campo receptivo de cada célula. La forma q adoptan estos campos
receptivos puede describirse por medio de una función de Gabor, equivalente a
multiplicar una función sinusoidal por una función normal como se muestra en la Fig
3.15. Obsérvese la semejanza entre la forma de la función de Gabor en esta figura con
la respuesta de las células de la Fig 3.14. Los DeValois midieron cuidadosamente la R
de las células simples y complejas de Hubel y Wiesel a la frecuencia espacial.
Encontraron q el grado de respuesta a la frecuencia espacial se extendía en un
continuo q iba desde células q tenían un campo receptivo finamente sintonizado a dets
frecuencias espaciales a células con una sintonía mucho más amplia. En general las
células q responden a frecuencias espaciales altas tienen campos receptivos más
estrechos q las sintonizadas a frecuencias espaciales bajas.
Tb suele ocurrir q las simples tienden a responder a una banda de frecuencias más
estrecha q las complejas aunq la diferencia no es muy grande. El grado de
selectividad a la frecuencia espacial está correldo con el grado de selectividad a la
orientación: las células q responden a bandas estrechas de frecuencia espacial tb
responden a un rango estrecho de orientaciones diferentes y las q responden a un rango amplio de frecuencias espaciales tb
lo hacen a un amplio rango de orientaciones.
Para los DeValois tb la corteza estriada está organizada funcionalmente en módulos, pero han propuesto una ampliación de
la idea de Hubel y Wiesel añadiendo una 3ª dim: la frecuencia espacial. El módulo cortical sería parecido al de la fig 2.5
pero ampliando la representación de la superficie que muestra la orientación de las líneas. En esta superficie la frecuencia
espacial estaría representada desde el centro hacia la periferia de cada orientación. Así las bajas frecuencias espaciales
estarían representadas en el centro mientras q la representación se desplazaría hacia la periferia a medida q la frecuencia
espacial aumentara. Para losDeValois, por tanto, el hecho de q las células de la corteza estriada procesen frecuencia
espacial no es un hecho contrario a la propuesta de Hubel y Wiesel respecto a las mismas sino complementario. Tb las
implicaciones para una teoría de la percepción no necesitan ser antagónicas. En el cap sobre la percepción del color vimos
q la teoría tricromática y la de los procesos oponentes fueron consideradas antagónicas durante mucho tiempo y dp se pudo
ver que eran complementarias a distintos niveles de procesamiento. Es posible q lo mismo pueda ocurrir con las dos
interpretaciones del func de las células de la corteza estriada. Es posible que en un 1r nivel de procesamiento tenga lugar
un barrido del patrón estimular q lo descomponga en términos de frecuencias espaciales y q los detectores de caracs
representen un nivel de proces posterior. Una propuesta como ésta fue de hecho formulada por Marr al exponer su primera
fase en el procesamiento de los objetos visuales. Pero la propuesta de Marr estuvo hecha desde una perspectiva de carácter
computacional y es este tipo de aprox el 3r punto de interés de este tema que ahora pasamos a considerar.
3. LA APROXIMACIÓN COMPUTACIONAL
En el cap primero vimos q la aprox computacional ha aportado a la teoría de la percepción el interés por la especificación
precisa de los procesos mediante su formalización en términos de programas. También q la teoría de David Marr fue en su
momento un verdadero punto de inflexión dentro de la teoría de la percepción visual, influyendo en la forma de pensar
acerca de los procesos perceptivos. Al exponer la teoría de Marr, mencionamos 3 niveles de org del procesamiento visual:
esbozo primario, el esbozo 2. 1/2-D, y el esbozo 3-D. En este cap estudiamos la fase correspondiente al esbozo primario en
el que Marr abordó el problema referente a la representación perceptiva más elemental o primitiva.
3.1. El esbozo primario El objetivo de la 1ª fase (esbozo primario) es hacer explícitos tanto los cambios de intensidad de
la imagen que proporcionan las vías visuales, como la distribución de esos cambios en la escena y su org geométrica. La
descripción explícita de esos cambios se hace especificando las características primitivas simbólicas de la imagen q, según
Marr, son 4: bordes, barras, terminaciones y manchas y los parámetros fundamentales de cada una de esas caracs
primitivas que son: posición, tamaño, orientación y contraste.
El punto de partida de esta fase es la imagen bidimensional proporcionada por los receptores visuales que representa la
distribución de luminancia de la escena y q es una representación analógica de la misma.
El resultado final es una representación simbólica formada por los 4 tipos de caracs q describen los cambios de intensidad
y q, organizadas en conjuntos resultantes de la aplicación de principios de agrupamiento, servirán como descripción básica
a los restantes niveles de procesamiento. Para Marr, por tanto, el sistema visual se hace simbólico muy pronto, en la 1ª fase
de proces, dando lugar a una descripción de la imagen considerablemente reducida en comparación con la original pero q
sigue conservando los aspectos importantes necesarios para el análisis de la imagen.
Para lograr los objetivos del esbozo primario, Marr asume q los mecs visuales operan con un conjunto supuestos generales;
respecto a la naturaleza de las imágenes; q hacen referencia tanto a la naturaleza de las superficies en el mundo visual
como al modo en q esas superficies se representan en la imagen. Ej: Marr cree lógico suponer q el mundo visible está
compuesto de superficies lisas q tienen funciones de reflectancia cuya estructura espacial podemos descubrir. Tb piensa q
las funciones q describen las superficies pueden hacerlo en escalas diferentes; unas nos describen los aspectos globales de
la superficie, otras los aspectos referentes al detalle, etc. En general asume q las superficies constitutivas de las imágenes
visuales son estables, tienen un alto grado de homogeneidad y las transiciones de luminancia dentro de ellas tienden a ser
suaves y no bruscas. Estos supuestos permiten orientar el func del sistema en esta 1ª fase. 2 subfases del esbozo primario:
1) esbozo primario bruto: los procesos que permiten pasar de la descripción analógica proporcionada por la distribución
de luminancia q describe la escena, a la descripción simbólica basada en las características primitivas.
2) esbozo primario completo: está dedicada a la exposición de los principios de org que permiten agrupar las
características primitivas en conjuntos y zonas que estructuran la escena.
3.2. El esbozo primario bruto El punto de partida del proces visual es la imagen más simple q pueden producir el
conjunto de nuestros receptores: una representación bidimensional de los difs niveles de intensidad luminosa que tienen los
puntos q la componen. Es una representación monocromática, monocular y estática. Imaginarla como la superficie de una
tv en blanco y negro compuesta x puntos elementales o píxeles cada uno con un nivel particular de intensidad luminosa.
Aunq la distribución de los receptores en la retina no tiene la homogeneidad espacial de los píxeles de una pantalla.
El objetivo dar una descripción de los cambios de luminancia existentes en la imagen en diferentes escalas y clasificar los
que sean relevantes en las 4 cats de caracs primitivas. Tanto Marr como la mayor parte de los investigadores en inteligencia
artificial han prestado especial atención a la clasificación de los bordes, por ello nos centraremos en su estudio y nos
servirán como ej en la comprensión del esbozo primario bruto.
A partir de la imagen en nivel de gris, la detección de los bordes tiene lugar por medio de un conjunto de operaciones que
pueden ser desglosadas de la forma que a continuación se indica.
3.2.1. Filtrado de la imagen. La imagen es analizada a distintos niveles de detalle, unos más globales y otros más
precisos. En este punto Marr y Hildreth incorporan la idea de los filtros espaciales que hemos estudiado anteriormente.
Para ellos la forma de los filtros espaciales es parecida al sombrero mexicano propio de una curva normal (gaussiana)
bidimensional, y dependiendo del mayor o menor tamaño del campo receptivo de los filtros, se producirá un mayor o
menor grado de apariencia difuminada en la imagen. La fig 3.10: resultado de la actuación de estos filtros. La imagen en
(a) es la fotografía original, los filtros amplios proporcionan en (b) una
imagen más difuminada que la proporcionada en (e) por los estrechos,
debido a q son sensibles a las frecuencias espaciales bajas que son las q dan
inf sobre los aspectos globales de la escena. Por el contrario, los filtros
estrechos dan inf de los detalles de la imagen ya que son sensibles a las
frecuencias espaciales altas. El filtrado de la imagen se puede entender tb
por referencia a los píxeles d una pantalla de tv o de un monitor. Un filtrado
de la imagen es equivalente a sustituir el valor de luminancia de cada píxel
por el valor de luminancia promedio de un conjunto de píxeles d su entorno.
Cuanto mayorsea el nº de píxeles que forman el conjunto de puntos q se
promedian, más ancho será el filtro. El filtrado de la imagen permite un análisis de la misma escena en diferentes escalas y
una determinación de las diferencias en luminancia para cada escala de filtrado de la imagen.
3.2.2. Localización de los puntos de cruce de cero. Para entender este 2º paso repasar algunos conceptos elementales
reldos con el análisis de imágenes. La Fig
3.16 será útil para esto.
A: imagen sencilla formada x un borde
producido por un cambio brusco en la
luminancia de la escena.
B: la fig ha sido digitalizada, es decir
sustituida x una matriz cuyas entradas
representan puntos en la imagen y en la que
el valor numérico de cada entrada
representa la intensidad luminosa de cada
punto. Podemos observar q el borde está
situado en la parte de la figura en la que se
produce la transición desde una intensidad
baja (02, en unidades arbitrarias) a una alta
(10).
C: se presenta el gráfico q muestra la intensidad luminosa para cada punto en la dirección horizontal de la imagen en A.
Unas nociones elementales de cálculo nos enseñan q la derivada de una función en un punto nos informa sobre el cambio
de los valores de la función en ese punto.
D: nos presenta el gráfico de la función derivada de la función representada en C. Este gráfico representa el cambio de
intensidad que tiene lugar para cada punto en la dirección horizontal de la imagen. En una imagen digitalizada, como la de
B, se puede hallar la función derivada a lo largo del eje horizontal calculando la diferencia entre los valores de los puntos
vecinos a lo largo de dicho eje. En el campo de la inteligencia artificial estos cálculos se llevan a cabo por medio de
operadores de bordes como los representados en E. Un operador de bordes es un esquema de cómputo para integrar los
valores de intensidad de un determinado entorno de píxeles adyacentes en la imagen; el resultado del cómputo es un nº que
nos informa sobre la existencia o no existencia de un borde. Ej: los operados q se muestran en E indican el peso o signo q
debe darse a cada valor de intensidad antes de proceder a la suma de los valores a los que se aplica. El primero de ellos, El,
se aplica a conjuntos de dos puntos e indica que el valor de intensidad del primer punto debe ir dotado de signo negativo
mientras q el valor de intensidad del segundo es positivo. Al aplicar este esquema de cómputo a dos puntos contiguos lo q
se hace es calcular la diferencia entre las intensidades de los dos puntos. Si no hay diferencia el resultado será igual a cero.
Si hay diferencia, el nº resultante nos indicará la magnitud de la diferencia y el signo la dirección del cambio ya que un nº
positivo indica un cambio de menos a más intensidad y un negativo indica un cambio de más a menos intensidad. Si se
aplica de forma sistemática este operador a la imagen digitalizada del apartado B, comenzando por la parte superior
izquierda y procediendo hacia abajo, obtendremos los valores q aparecen en la 1ª columna de la matriz mostrada en F. El
resto de los valores de la matriz se obtiene repitiendo la misma operación de arriba abajo pero comenzando una columna
más a la derecha. Obsérvese q todos los valores de la matriz en F son iguales a cero para los puntos en q no hay cambio en
los valores de intensidad y son distintos de cero en los puntos en los q se produce el cambio de intensidad con un valor (+8)
igual a la magnitud de la diferencia en intensidades y un signo apropiado a la dirección del cambio. La operación q
acabamos de realizar, consistente en hallar la suma ponderada de sus intensidades para cada dos puntos de la imagen a lo
largo de todos los puntos de la imagen, recibe el nombre de convolución de un operador de bordes con una imagen.
Obsérvese q si trazáramos el gráfico de los valores de la matriz en F para los puntos de la matriz en la dirección horizontal,
el resultado sería igual que el gráfico mostrado en D que es el de la derivada de la función de intensidad.
Un operador como este se llama de operador diferencial de primer orden porque calcula la diferencia simple entre píxeles
contiguos. El resultado de la convolución del operador con la imagen nos permite detectar los puntos en los q tiene lugar
un cambio de intensidad dando lugar a un borde. El borde viene indicado por los valores extremos de la matriz resultante.
El operador mostrado en el apartado E2 de la Fig 3.16 presenta un esquema
de cómputo más complejo que el anterior. Es un operador diferencial de
segundo orden porque su convolución con una imagen equivale a calcular la
segunda derivada de la función de intensidad de la imagen. El apartado G de
la Fig 3.16 presenta el resultado de aplicar este operador a la imagen
digitalizada en B y el apartado H presenta el gráfico de los valores obtenidos
en G que corresponden a la segunda derivada de la función de intensidad. Al
punto en el que la función pasa por el valor cero cuando baja desde su valor
máximo (+8) a su valor mínimo (-8) se le llama punto de cruce de cero. En la
figura aparece indicado por una flecha. Los puntos de cruce de cero son los
indicadores de un borde cuando se utiliza un operador diferencial de segundo
orden. Obsérvese que no son puntos de cruce de cero todos los puntos de la
imagen en los q el valor de la segunda derivada de la función de intensidad es
cero sino sólo aquellos en los q la segunda derivada cruza un valor cero
flanqueado por valores extremos. Obsérvese tb q los puntos de cruce de cero
producidos por un operador diferencial de segundo orden son en la imagen los
mismos q muestran un valor extremo como resultado de la aplicación de un
operador diferencial de primer orden.
Ahora estamos en condiciones de entender un poco mejor la teoría de Marr
respecto al esbozo primario bruto. Para cada imagen filtrada a diferentes
niveles de frecuencia espacial se lleva a cabo la convolución de esa imagen
con un operador diferencial de segundo orden como el mostrado en la Fig 3.17 para determinar los puntos de cruce de cero
indicadores de la presencia de un borde. La fig 3.18 da un ej del resultado de las fases correspondientes a la diferenciación
de la imagen de una planta situada detrás de una alambrada.
En A aparece la imagen en nivel de gris de la planta. En B la imagen resultante de la convolución de la imagen en A con un
operador laplaciano, como el de la fig 3.17, dp de ser filtrada por un filtro gaussiano con una desviación típica equivalente
a 8 píxeles. En C se muestran respectivamente en blanco y negro los valores positivos y negativos resultantes de la
convolución anterior. En D solo se muestran los puntos de cruce de cero. Como se ve, los puntos de cruce de cero dan una
buena base sobre la que determinar los bordes de la imagen.
La Fig 3.19 da otro ej del valor informativo q dan los puntos de cruce de cero. La imagen de la derecha muestra los puntos
de máximo contraste de la imagen de la izquierda hallados mediante un operador diferencial de segundo orden. En la
imagen de la derecha se ha variado la intensidad de las líneas de modo q las q tienen un mayor contraste sean más intensas.
Los puntos de cruce de cero son en la teoría de Marr el principal proced por el que el sistema visual sienta las bases para
pasar de una representación continua de carácter analógico a una representación discreta de carácter simbólico.
3.2.3. La determinación de las características. A partir de la determinación de los puntos de cruce de cero y para llegar a
la descripción simbólica final, el sistema visual necesita integrar la inf q procede de los filtros de dif tamaño. Los cambios
de luminancia q dan origen a un punto de cruce de cero pueden estar provocados por fs muy diferentes en el mundo físico:
cambios en la iluminación de la escena, cambios en la reflectancia de las superficies, en la orientación o distancia de las
superficies con respecto al observador, etc. El sistema visual tiene q discriminar qué puntos de cruce de cero corresponden
a un mismo fenómeno físico y cuales a fenómenos físicos diferentes. Según Marr, el sistema visual consigue asignar los
puntos a fenómenos físicos integrando la inf proporcionada por los puntos de cruce de cero de las distintas escalas q
proporcionan los filtros de diferente tamaño. El principio fundamental q orienta esta fase del procesamiento se conoce
como supuesto de coincidencia espacial y dice así:
Si en un conjunto de canales independientes, de una gama continua de tamaños (filtrados mediante un operador laplaciano) está
presente un segmento de puntos de cruce de cero y este segmento tiene la misma orientación y posición en cada canal, entonces el
conjunto de segmentos de puntos de cruce de cero indica la presencia de un cambio de intensidad en la imagen q se debe a un único
fenómeno físico (un cambio en la reflectancia, iluminación, profundidad u orientación en la superficie).
Si no existiera coincidencia espacial en los distintos canales, probablemente los puntos de cruce de cero tendrían su origen
en distintos fenómenos físicos o en distintas superficies. Mediante la aplicación de este y otros supuestos reldos se acaba
logrando, según Marr y Hildreth, la descripción simbólica de la imagen en términos de las 4 caracs primitivas: bordes,
barras, manchas y terminaciones. La Fig 3.20 muestra la forma q adopta la descripción final del esbozo primario bruto de
la imagen de la Fig 3.18. En A y B se muestran los puntos de cruce de cero correspondientes a dos filtros de tamaño
diferente; el usado en A es más fino q el usado en B. En los siguientes apartados la fig muestra el resultado de la
integración de ambos filtros para generar un mapa de bordes orientados (D) y de los análisis q originan un mapa de
manchas (C) y otro de barras (E). El resultado final del esbozo primario bruto es un conjunto de 4 mapas con la descripción
de las caracs, cada una de ellas especificada por los parámetros correspondientes a su posición, orientación, contraste, y
tamaño, éste último expresado en términos de longitud y anchura.
3.3. Bases fisiológicas del esbozo primario bruto
En esta etapa de proces visual Marr tb prestó atención a los aspectos reldos con la realización física de estos procesos en el
cerebro humano. Especialmente se interesó por los mecs capaces de realizar el cómputo de los puntos de cruce de cero.
Marr pensó q el campo receptivo de las células ganglionares y de las células del núcleo geniculado lateral del tálamo
muestran caracs similares a las del operador utilizado por ellos que aparece en la Fig 3.17. En el apartado G y H de la Fig
3.16 hemos visto q los puntos de cruce de cero están flanqueados por valores extremos de la segunda derivada de la
función de luminancia. Marr asumió q las células del núcleo geniculado organizadas como aparece en la Fig 3.21, de forma
q un conjunto de células con centro off y entorno on estén alineadas y adyacentes a un conjunto alineado de células con
centro on y entorno off, forman la base para lograr el cómputo de los puntos de cruce de cero.
Siempre que ambas filas de células estén activas simultáneamente se producirá la presencia de puntos de cruce de cero
entre ellas. Si otro conjunto de células en un nivel de procesamiento superior recibe inf de ambas células y solamente
dispara cuando ambas están activas estas células Y actuarán como verdaderos detectores de puntos de cruce de cero. Si a su
vez estas células están sintonizadas a orientaciones diferentes y se organizan entre sí en alineamientos de una det
orientación, tendremos la base para la detección de segmentos de puntos de cruce de cero q, como hemos visto, forman en
la teoría de Marr la base sobre la cual se lleva a cabo el cómputo de las caracs primitivas. Para Marr la función q llevan a
cabo las células simples de la corteza estriada es precisamente detectar los puntos de cruce de cero como se ha explicado.
3.4. Valoración de la teoría de David Marr fue la 1ª teoría computacional de la visión general y que organizó las
principales contribuciones q las invests en inteligencia artificial habían aportado al campo de la percepción visual. En este
tema su aportación tb fue pionera y el esquema de detección de bordes basado en operadores laplacianos de una gaussiana
continúa dominando en los modelos de sistemas biológicos de detección de bordes. Más problemática para la teoría de
Marr y Hildreth fue la forma en que resuelve el problema de la integración de escalas de puntos de cruce de cero, pq nunca
dieron un algoritmo preciso. Pero la principal aportación de Marr fue la nueva forma de pensar q introdujo al teorizar sobre
la percepción visual apuntando a los problemas centrales q toda teoría debe resolver en cada nivel de procesamiento.
CONCLUSIÓN Hemos visto q en torno a la interpretación de la función de las células de la corteza estriada se han
acuñado las principales teorías de la percepción de la forma. A las invests fisiológicas de Hubel y Wiesel siguieron las
aportaciones teóricas desde la psicofísica de Campbell, Robson, Blakemore, Graham y los DeValois a favor de la defensa
de filtros de frecuencia espacial. La interpretación inicial de Hubel y Wiesel sobre el func de las células de la corteza
cerebral se hizo en términos de detectores de caracs entendiendo este término de forma demasiado simple, como la
respuesta directa de una célula a las caracs elementales del E. Cuando la invest posterior mostró la existencia de células q
respondían a caracs más complejas o incluso a objetos, se perdió la confianza en un tipo de teoría q todo lo resolviera a
base de encontrar una célula para cada objeto o parte de un objeto. La invest se orientó hacia la búsqueda de una
descripción del E q fuera elemental en sus cs básicos, aplicable de forma generalizada a todo E posible y realizable por las
células de la corteza.
T.4 EL ESPACIO TRIDMENSIONAL Explicamos cómo el sistema visual consigue una representación de espacio
tridimensional, cómo se logra recuperar la profundidad de la escena visual, pero desde una perspectiva constructivista q,
concibe la percepción visual como un conjunto de procesos q, a partir de la inf q da la luz, construye una representación de
la escena q permita reconocer los objetos. Dsd la perspectiva constructivista, la forma de abordar el proces d la profundidad
consiste en buscar en la escena bidimensional las claves o indicios q permiten alcanzar una representación tridimensional.
Una alternativa es la perspectiva ecológica ligada a las invests de Gibson. Desde este punto de vista no tiene sentido buscar
claves en una representación bidimensional pq la percepción visual es directa, no está mediada x una representación. La
percepción consiste en la extracción por el observador de la inf presente en el E y la inf acerca de la profundidad está tan
presente en la inf proporcionada por el patrón general de estimulación como cualquier otra.
1. LAS CLAVES DE PROFUNDIDAD
Las claves Monoculares, q están disponibles para cada uno de los ojos con independencia del otro:
- las claves estáticas, provenientes de una escena visual sin movimiento. Dentro de las estáticas distinguiremos:
claves oculares: tienen su origen en el func mecánico de la musculatura ocular, y
claves pictóricas: por su estrecha rel con la pintura y del dibujo.
- las claves dinámicas, provenientes de una escena visual en mov, pq hay mov en los objetos o pq se mueve el observador.
Las claves Binoculares, q resultan de la integración de la inf de los dos ojos, como la convergencia y de la estereoscopia.
1.1 Claves monoculares
1.1.1 claves estáticas Pueden ser de dos tipos, oculares y pictóricas.
1.1.1.1 claves oculares
Acomodación: cambio en la forma del cristalino para mantener la imagen del objeto focalizada sobre la retina. Cuando el
objeto está alejado del observador el cristalino tiende a disminuir de grosor y a hacerse más plano para facilitar el enfoque
de los rayos q desde el objeto llegan al cristalino en paralelo. Pero cuando se aproxima al observador, los rayos procedentes
del mismo divergen a medida q se acercan al ojo. En este caso el cristalino aumenta su convexidad aumentando de grosor y
de esta forma facilita el enfoque de la imagen sobre la retina. La forma del cristalino cambia por los músculos ciliares cuya
contracción provoca el aumento de grosor y cuya relajación lo disminuye. Si el sistema visual tiene inf sobre la tensión de
los músculos ciliares, entonces tb puede tener inf sobre la distancia a la q está el objeto focalizado.
El valor de la acomodación como indicador de distancia es efectivo sólo en distancias cortas, inferiores a 2’5m aprox.
Incluso dentro de este rango de distancia, los observadores no usan la inf sobre distancia q da la acomodación cuando
tienen q hacer juicios directos sobre la distancia de un objeto sino al hacer juicios sobre el tamaño de los objetos.
El sistema visual calcula el tamaño de los objetos tomando en cuenta la inf proporcionada por la acomodación.
Un aspecto interesante de este indicador es q da inf sobre la distancia absoluta a la q se encuentra un objeto. La mayor
parte de los indicadores monoculares de profundidad dan inf sobre la distancia relativa de los objetos señalándonos cual de
dos o más objetos está más próximo a nosotros, pero no nos informan de la distancia a la q esos objetos están de nosotros.
El conocimiento de la distancia absoluta a la que se encuentran los objetos es necesario para poder alcanzarlos con
precisión y para moverse en su entorno sin tropezar con ellos.
1.1.1.2 claves pictóricas
- perspectiva lineal: En el uso común: reglas q permite a los artistas crear proyecciones bidimensionales precisas de las
formas esquemáticas de objetos tridimensionales. El plano sobre el q se llevan a cabo esas proyecciones es el plano de
proyección y está perpendicularmente a la línea de visión q va del observador al objeto.
En la Percepción visual: las rels existentes dentro de la escena visual q subyacen a ese conjunto
de reglas y tb en parte a la percepción de la distribución espacial.
Una de las reglas más básicas de la perspectiva lineal es la convergencia de paralelas según la
cual las líneas paralelas en el espacio tridimensional se representan en dos dims por líneas q
convergen hacia un único punto llamado punto de fuga. La exp común de convergencia de las
vías de un tren cuando estando entre ellas miramos a lo lejos es tb un ej de perspectiva lineal.
Fig 4.1 el punto de fuga está en la línea del horizonte de la superficie q sirve de punto de ref
para dividir el espacio visual en dos zonas, una superior y otra inferior. En general, la línea del horizonte de una superficie
es la línea q pasa por dos o más puntos de fuga de conjuntos de líneas paralelas q se extienden en la superficie.
La perspectiva lineal basada en la convergencia de paralelas produce una compresión lateral de las superficies implicadas.
Fig 4.2 muestra el contorno de una superficie cuadrada q está inclinada con respecto a un eje horizontal en el plano frontal.
La inclinación produce en el observador una proyección trapezoidal de la superficie de
forma que el borde que se inclina hacia el observador aparece más largo que el que se
inclina lejos del observador provocando una compresión lateral que tiende a
concentrarse en el punto de fuga.
La convergencia de paralelas propia de la perspectiva lineal nos permite entender la
relación entre el punto de fuga y la orientación de los bordes de una superficie. Si se
mide la orientación de un borde por ref a un marco fijo del medio ambiente, entonces
todos los bordes q tienen la misma orientación son paralelos entre sí y la proyección de este conjunto de bordes paralelos
en el plano de proyección es un conjunto de líneas q convergen en un único punto de fuga. El punto de fuga de un borde
puede concebirse como el término final de la proyección de un borde cuando se extiende infinitamente en la distancia.
Existe, por tanto, una rel uno a uno entre el punto de fuga y la orientación de un det conjunto de bordes, de forma q para
cada orientación det de un borde hay un correspondiente punto de fuga y cada punto en el plano de proyección es el punto
de fuga de un conjunto de bordes paralelos q tienen la misma orientación. El punto de fuga de un borde contiene, x tanto,
inf específica sobre su orientación. Esta rel entre punto de fuga y orientación de los bordes no varía aunq cambie el punto
de observación; cada punto de fuga permanece fijo en su posición de correspondencia con las orientaciones fijas de los
bordes en el medio ambiente. La correspondencia entre los distintos puntos de fuga y la orientación de los bordes, cuyas
proyecciones convergen en esos puntos, contribuye a estructurar un entramado de rels altamente informativas sobre la org
tridimensional de una escena.
- altura relativa: La posición de los objetos en rel con la línea del horizonte es un importante indicador de profundidad
incluso en escenas en las q la convergencia de paralelas en un punto de fuga no está presente. Generalmente aquellos
objetos q se encuentran próximos a la línea del horizonte de una superficie bidimensional son percibidos como más
lejanos. La potencia de la altura relativa como clave de profundidad o de distancia depende de la presencia de un marco de
ref q, por lo general, es la línea del horizonte. El efecto de profundidad se acentúa por la presencia de textura dentro del
marco de ref. En ausencia de un marco de ref, el efecto de profundidad queda casi anulado.
- perspectiva aérea: cambios en contraste y en color q experimenta la percepción de los objetos cuando están a gran
distancia del observador. El contraste tiende a reducirse haciendo q la imagen de los objetos aparezca más borrosa debido a
la dispersión de la luz q provocan las partículas de polvo y agua suspendidas en la atmósfera. Con respecto al color, la
lejanía de los objetos tiende a acentuar las tonalidades azuladas debidas tb a q las longitudes de onda cortas son más
fácilmente perturbadas por las partículas suspendidas en la atmósfera q las de onda largas y por lo tanto experimentan una
dispersión mayor.
- tamaño relativo: si dos objetos son presentados en el campo visual simultáneamente o en próxima sucesión, aquel que
produce una imagen retiniana mayor, parecerá estar más cerca. En la Fig 4.2 la influencia de la perspectiva lineal para
producir profundidad en la percepción, se ve reforzada por el tamaño relativo de los dos segmentos horizontales q forman
parte del trapezoide. El segmento largo aparece más cercano al observador que el corto. En este ej, los dos segmentos están
conectados, pero no es preciso que exista conexión para que esta clave de profundidad tenga efecto.
- tamaño familiar: experimentos que han utilizado objetos familiares para los participantes, tales como cartas de una
baraja o monedas de uso corriente, han puesto de manifiesto que, si se conoce el tamaño real de un objeto, el tamaño de la
imagen proyectada sobre el observador es un buen indicador de la distancia a la que se encuentra el objeto. El tamaño
familiar es un ejemplo claro de la influencia que la experiencia puede tener sobre los procesos de percepción.
- gradiente de textura: casi todas las superficies tienen una estructura q consta de unidades o elementos, relativamente
homogéneos en tamaño y forma, distribuidos por la superficie con relativa regularidad. A la cualidad producida por este
tipo de estructura se le da el nombre de textura. La distribución de granos de arena en una playa y la de las baldosas de un
cuarto de baño son ejs de superficies con texturas diferentes. Gradiente: es la proporción en q una det propiedad cambia a
lo largo de un continuo. El gradiente de textura hace ref al cambio gradual q la percepción de la textura de una superficie
experimenta a medida q ésta está más alejada del observador. Los principales cambios afectan al tamaño de los elementos,
q se hacen progresivamente más pequeños, y a la densidad de los mismos, que aumenta a medida q la superficie se aleja.
La Fig 4.3 A un ej de superficie en la q el gradiente de textura proporciona una fuerte
sensación de profundidad.
Además de informar sobre la profundidad, el gradiente de textura tb puede dar inf sobre otras
caracs de la superficie, como su orientación en profundidad o su curvatura. En la fig anterior,
imagen B, se muestra cómo un cambio en el gradiente puede informar sobre la existencia de
una esquina, mientras q en C, la ruptura entre los dos gradientes proporciona inf sobre la
existencia de un borde. Gibson, q formuló la aproximación ecológica al estudio de la
percepción, consideró que el gradiente de densidad de textura es uno de los aspectos de la
estimulación que mayor inf proporciona sobre la profundidad porque afecta a la estructura
general del patrón estimular. El gradiente de densidad de textura proporciona una escala
absoluta de distancia respecto a la que se puede medir toda otra distancia.
- sombreado y sombras. La posición relativa existente entre la fuente de la iluminación, las superficies iluminadas y el
observador, determina la cantidad de luz q acaba llegando al ojo del último. Sombreado hace ref a los cambios en el
patrón de luminancia q se produce como consecuencia de la variación en el ángulo q forman la luz q incide sobre una
superficie y la superficie misma. Existen diferentes tipos de sombreado:
- sombreado especular el propio de superficies brillantes como un espejo y depende fund de la posición del observador y
de la dirección de la iluminación.
- sombreado difuso o Lambertiano el propio de las superficies mate cuya reflectancia es igual en todas las direcciones.
La cantidad de luz reflejada por cada punto de la superficie depende de su orienración respecto a la fuente de luz, siendo
máxima en los puntos en q la luz incide perpendicularmente sobre la superficie. Por ello, cuando superficies de la misma
reflectancia presentan ángulos diferentes respecto a la misma fuente de iluminación, pueden dar lugar a bordes de
iluminación. El sombreado es un potente indicador de los aspectos volumétricos de las formas, en particular sus
concavidades y convexidades. Gibson llamó la at sobre el hecho de q la percepción de una escena tiende a organizarse
como si estuviera iluminada x una sola fuente de luz y desde arriba. Probablemente este supuesto interpretativo actúa como
una constricción en el sistema perceptivo y es el resultado de un largo proceso evolutivo de adaptación
al medio terrestre.
La Fig 4.4 ilustra la fuerza de este supuesto en un caso relativamente simple. Los objetos circulares de
la fila superior aparecen como bultos convexos que se aproximan hacia el observador, mientras que los
de la fila inferior aparecen como pequeñas concavidades que tienden a alejarse del observador. El
efecto es perfectamente reversible si el lector da la vuelta a la página.
Este cambio se debe al supuesto q estamos comentando de q los objetos circulares están recibiendo la luz de una misma
fuente situada sobre ellos. Los objetos circulares iluminados en su parte superior y obscurecidos en su inferior son
percibidos como convexos, ya q su patrón de sombreado corresponde al de un objeto esférico iluminado desde arriba. En
los obscurecidos en su parte superior e iluminados en su inferior, el patrón de sombreado corresponde al de una concavidad
iluminada desde arriba y en consecuencia son percibidos como una oquedad. Ramachandran ha puesto de manifiesto que el
supuesto que parece realmente enraizado en nuestro sistema visual es el de la existencia de una sola fuente de luz. La
localización de la fuente depende para su determinación de diferentes fs que interactúan entre sí.
La Fig 4.5 presenta un ej proporcionado por este autor. Las máscaras que aparecen son en efecto
máscaras, pero fotografiadas por su lado cóncavo, el que se ajusta a la cara de la persona que se la
pone, e iluminadas desde arriba. Sin embargo son claramente percibidas como máscaras vistas
por su lado convexo e iluminadas desde abajo. El efecto pone de manifiesto la importancia que
factores tales como la experiencia previa y el contexto pueden tener en la determinación de
nuestra percepción. En este caso, ante un estímulo extraño como es el lado cóncavo de una máscara, nuestro sistema visual
prefiere ver caras normales convexas aunque para ello tenga que asumir que la luz viene de abajo. El efecto del contexto
puede comprobarse si fijamos nuestra atención sobre los dos círculos que aparecen entre las dos máscaras. Si aislamos su
percepción del influjo de las caras tapándolas, el círculo de la izquierda tiende a percibirse como cóncavo y el de la derecha
como convexo, de acuerdo con una percepción que asume que la fuente de luz viene de arriba. Sin embargo, cuando los
dos círculos se incluyen en las caras, donde predomina la percepción de la iluminación desde abajo, el cír· culo de la
izquierda aparece convexo, parecido a un bulto en la cara, y el de la derecha cóncavo.
Una sombra cuando un objeto se interpone entre una fuente de iluminación y una superficie, proyecta sobre ésta una
sombra que proporciona inf sobre la escena tridimensional. La forma de la sombra depende de: la proximidad de la fuente
de iluminación, su dirección, la forma del objeto que proyecta la sombra, el relieve de la superficie sobre la que es
proyectada y la posición relativa entre la fuente, el objeto y la superficie. La sombra puede estar unida al objeto o separada
del mismo. Las sombras unidas al objeto indican que el objeto está apoyado sobre la superficie.
Fig 4.6 dos escenas iguales en todo, excepto en la posición de las sombras respecto al objeto
que las produce. En A, las sombras están unidas al objeto, lo que provoca la percepción de
las esferas como si estuvieran descansando sobre la superficie y alineadas diagonalmente en
profundidad de izquierda a derecha. En B las sombras se van separando de los objetos y
permanecen alineadas en dirección perpendicular a la línea de visión dando ocasión a una
percepción de las esferas como si estuvieran a diferentes alturas respecto de la superficie
pero en el mismo plano frontal.
- interposición: los objetos q están más alejados pueden quedar total o parcialmente ocultos
a un observador por otros objetos interpuestos en la línea de visión. Cuando un objeto
aparece parcialmente encubierto, nuestro sistema visual tiende a percibir como más alejado
al objeto tapado y como más cercano al interpuesto. La interposición es uno de los más potentes indicadores de
profundidad aunq se limita a darnos inf ordinal sobre la distancia de los objetos en relación al observador. Si el objeto A
oculta al objeto B y éste, a su vez, oculta a C entonces C es el más alejado del observador y A es el más cercano. La
interposición no nos informa de la magnitud de las distancias entre los objetos y el observador.
1.1.2 Claves dinámicas
El movimiento del observador y de los objetos da lugar a nuevas claves de profundidad y de distancia. El estudio de la
percepción del movimiento tiene una gran importancia en sí mismo y por ello le dedicamos un cap.
1.1.2.1. Paralaje de movimiento. Cuando un observador se mueve en dirección lateral, ej: de derecha a izquierda, con
respecto a su campo de visión, los objetos que se encuentran a distancias diferentes proyectan unas imágenes en la retina
que se mueven en sentido y a velocidades diferentes. Paralaje de movimiento: el desplazamiento diferencial de las
imágenes, proyectadas por distintos objetos, debido a un cambio lateral en la posición del observador y a la distancia
relativa de los objetos con respecto al punto de fijación.
Una forma sencilla de entender esta claveconsiste en colocar el dedo pulgar de cada mano a distintas distancias en la línea
de visión y alinearlos con un tercer objeto más alejado que sirva de ref. Si en esa sit, con los dedos y el objeto a distintas
distancias en la misma línea de visión y el punto de fijación situado en el objeto más alejado, movemos la cabeza hacia la
derecha, notaremos que los dos dedos se mueven hacia la izquierda en relación con el tercer objeto pero que el dedo más
cercano se mueve más lejos y más rápidamente. Si movemos la cabeza hacia la izquierda, el movimiento de los dedos
respecto al objeto cambiará de sentido pero, de nuevo, el dedo más cercano se moverá más lejos y más rápidamente. En
general, los objetos más cercanos parecen desplazarse más lejos y a mayor velocidad mientras que para los más alejados el
desplazamiento es menor y más lento. Pero el sentido del mov no depende únicamente de la distancia a la q están los
objetos sino también de la posición del punto de fijación. Los objetos que están situados en una posición más cercana al
observador que aquella en la que cae el punto de fijación, se mueven en sentido contrario al observador, mientras que los
situados en una posición más alejada que el punto de fijación se mueven en el mismo sentido que el observador. Si no ha
bajado usted los dedos, compruebe este efecto fijando ahora la mirada en el dedo que está entre el objeto que antes servía
de punto de referencia y el dedo más cercano a usted. Observe cómo el objeto más alejado se desplaza en el sentido del
movimiento de su cabeza, mientras que el dedo más cercano a usted lo hace en sentido contrario.
El paralaje de mov es una clave de profundidad muy efectiva a grandes distancias incluso cuando no están presentes otras
claves de profundidad. Pero su efectividad aumenta cuando la inf espacial es rica y proporciona varios puntos de ref.
1.1.2.2. Flujo óptico. Para Gibson el análisis de la clave que hemos llamado paralaje de movimiento no es más que una
consideración par- cial de un patrón global de estimulación que él denominó flujo óptico. Con este término Gibson quiso
poner el énfasis en la necesidad de tomar en consideración las transformaciones del patrón global de estimulación cuando
un observador se mueve en el medio ambiente. Como vimos anteriormente en el estudio de la textura, también en este
contexto Gibson acentuó la importan- cia de los gradientes de movimiento refiriéndose a los cambios graduales en
velocidad y dirección que tienen lugar en la escena visual.
La Figura 4.7 presenta un esquema del flujo óptico de
una escena cuando el observador se mueve lateralmente
de derecha a izquierda con la mirada fija en el punto
central (F) de la escena.
Las flechas del esquema son vectores que indican, con
su punta el sentido de las distintas direcciones que corren
paralelas unas a otras, y con su longi- tud la mayor o
menor velocidad del conjunto de puntos organizados en
una determinada dirección. Como vimos al hablar de la
clave paralaje de movimiento, el sentido del movimiento
para todos los puntos que se encuentran por delante del punto de fijación es contrario al sentido del movimiento del
observador, mientras que el de los puntos que se sitúan por detrás del punto de fijación es igual que el del observador.
Además, el esquema hace explícita la representación del gradiente de velocidad presente en la escena, donde la velocidad
se va haciendo menor a medida q las direcciones se aproximan al punto de fijación y aumentan a medida q se alejan.
El análisis del flujo óptico cuando el movimiento del observador es lateral respecto de la escena no produce resultados muy
diferentes del análisis del paralaje de movimiento, aunque es importante tomar en consideración el valor informativo de los
gradientes. Una aportación más original de Gibson fue el análisis del flujo óptico cuando el movimiento del observador se
dirige directamente hacia un objeto o se aleja de él en el plano frontal. Al acercarse a una superficie u objeto, se produce un
fenómeno de expansión óptica consistente en que el punto de fijación permanece estático en la fóvea mientras que el resto
de puntos en el campo visual divergen hacia su exterior en todas las direcciones a partir del punto de fijación y a una
velocidad que es tanto mayor cuanto más alejados están del punto de fijación. Cuando la velocidad de expansión es alta, el
patrón de expansión produce la impresión de que la superficie se echa encima del observador. Por el contrario, cuando el
movimiento consiste en alejarse de un punto de referencia, el patrón que se produce es de contracción óptica en el que los
puntos del campo visual tienden a converger hacia el punto de fijación (ver Fig 5.9).
Los patrones de flujo óptico pueden resultar muy complejos y difíciles de analizar en términos matemáticos. Los ejemplos
que acabamos de estudiar permiten entender la naturaleza de estas claves de carácter global, que forman parte de la
contribución de Gibson al estudio de la percepción espacial.
1.1.2.3. El Efecto de profundidad cinética. No sólo resultan informativos respecto a la distancia o a la profundidad los
cambios en el flujo óptico producidos por el movimiento del observador, también los cambios en el patrón de estimulación
producido por el movimiento de un objeto pueden proporcionar inf sobre la profundidad. Un efecto q ha sido muy
investigado en la psicología de la percepción visual y q ejemplifica lo que acabamos de afirmar es el efecto de
profundidad cinética q Wallach y O'Connell mostraron por primera vez. Lo entenderemos mejor x referencia a la Fig 4.8
La sit q genera la estimulación es parecida a la usada para producir sombras chinescas.
Un objeto, en este caso un palo, colocado perpendicularmente sobre un eje vertical, que
puede hacerse rotar, se sitúa entre una fuente de iluminación y una pantalla traslúcida
sobre la que se proyecta la sombra del objeto. El observador se encuentra al otro lado de
la pantalla de forma que sólo es capaz de ver las sombras del objeto proyectadas en la
pantalla. Cuando el objeto está estático, no se percibe profundidad alguna, solamente la
sombra bidimensional del palo. Cuando se hace rotar el objeto en torno al eje vertical, la
sombra del palo aparece rotando tb en profundidad. Lo realmente curioso en este efecto
es q el patrón bidimensional de cambios en la sombra proyectada en la pantalla consiste
en una sucesión de líneas que varían en longitud y en orientación pero lo que el observador percibe no son las
deformaciones bidimensionales de un conjunto de líneas sino la forma invariante de un palo que rota en profundidad sobre
un eje. El hecho es que, de entre las distintas interpretaciones perceptivas que la estimulación puede tener, el sistema visual
impone una determinada: la de una forma rígida rotando en profundidad. Parece como si el sistema visual estuviera
sesgado a favor de esa forma de percibir mientras los datos que proporciona la estimulación sean consistentes con ella.
Se han dado varias explicaciones de carácter general a este fenómeno.
Los psicólogos de orientación empirista opinan que el sesgo está det por la experiencia ya que la rotación de formas rígidas
es más frecuente en el medio ambiente que las deformaciones plásticas bidimensionales. Los psicólogos de la Gestalt
opinan que la interpretación en términos de una forma rígida que rota es más simple. La verdad es que no tenemos un por
qué satisfactorio para este efecto, pero el efecto es robusto y demuestra sin lugar a dudas que el sistema visual es capaz de
recuperar la forma y el movimiento en profundidad de los objetos a partir de los cambios en longitud y en orientación de
formas bidimensionales. El efecto de profundidad cinética es un buen ejemplo del carácter constructivo de la percepción a
partir de una estimulación ambigua.
1.2. Las Claves binoculares
Son las q dan inf sobre la distancia combinando inf de cada uno de los ojos.
1.2.1. Convergencia binocular. Cuando fijamos la vista en un objeto, las líneas de visión de cada uno de los ojos
convergen en el punto de fijación. El ángulo de convergencia es el ángulo formado por estas líneas con vértice en el punto
de fijación. Su tamaño varía en función de la distancia a la q está el punto de fijación. Si el objeto se aproxima a nosotros,
el ángulo de convergencia tiende a hacerse mayor, y si el objeto se aleja, el ángulo tiende a disminuir.
La convergencia binocular, al igual que la acomodación, es una clave fisiológica porque el tipo de inf que proporciona se
refiere a los ajustes oculomotores que controlan la posición de los ojos.
Figura 4.9 ayuda a entender la forma en que la desviación de los ojos necesaria para producir
la convergencia binocular puede proporcionar inf sobre la distancia a la q está un objeto.
En la fig, el punto de fijación está en el punto P donde convergen las líneas de visión del ojo
derecho D e izquierdo I. La distancia a la que se encuentra el objeto está representada por la
línea discontinua (d), mientras que la distancia I- D corresponde a la distancia interpupilar q
en el adulto medio es de unos 65 milímetros. Sobre la base de las relaciones angulares que
aparecen en la figura puede calcularse la distancia a la que está el objeto. De forma sencilla,
puede considerarse la distancia interpupilar como el arco de un círculo y la distancia (d) como
su radio, con lo cual resulta que el valor del ángulo C: C = 65 / d
cuando C se expresa en radianes. El valor de C en esa ecuación puede conocerse ya que es
igual a la suma de los ángulos Ci + Cd que son los ángulos correspondientes a la desviación
de cada ojo al converger sobre el punto de fijación.
La ecuación muestra que el ángulo de convergencia puede ser usado por el sistema visual
para determinar la distancia al punto de fijación. Ahora cabe preguntarse si de hecho el
sistema visual utiliza esa inf. La respuesta es afirmativa pero solamente para distancias cortas.
porque la variación en el ángulo de convergencia sólo tiene lugar en distan- cias no superiores
a uno o dos metros. Más allá de los tres metros de distancia la posición de los ojos no cambia
por mucho que el objeto se aleje.
Normalmente la convergencia binocular actúa conjuntamente con la acomodación. A medida que un objeto se aleja, tanto
la convergencia como la acomodación varían por eso resulta difícil estudiar el papel de una de las claves y mantener
constante la otra. Podría parecer q tapando un ojo al observador anularíamos la influencia de la convergencia y aislaríamos
el efecto de la acomodación pero incluso en una situación así continúa funcionando el mecanismo de convergencia. Al
parecer, la inf proporcionada por la acomodación del cristalino del ojo no tapado es suficiente para guiar al mec de
convergencia. En conclusión, tanto la convergencia como la acomodación son claves útiles en distancias cortas y dan inf
sobre la distancia absoluta a la que se encuentra un objeto, cosa que pocas claves de distancia proporcionan.
1.2.2. La estereoscopia
La estereoscopia es una clave que nos proporciona información acerca de la distancia relativa de los objetos sobre la base
del desplazamiento lateral que la proyección de un objeto experimenta en las retinas de los dos ojos. En este apartado,
primero explicaremos los conceptos que nos ayudarán a caracte- rizar esta clave, posteriormente expondremos los
procedimientos utilizados en su estudio y terminaremos con una aproximación a los mecanismos que la producen. La
estereoscopia ha sido una de las claves cuyo estudio ha atraído en mayor medida el interés de los investigadores, por ello
merece la pena que le dediquemos una atención especial.
- conceptos fundamentales:
En la Figura 4.9 la imagen del punto de fijación (P) se proyecta en el centro de la fóvea de cada una de las dos retinas, la
derecha y la izquierda. Los puntos de cada retina sobre los que cae la proyección se llaman puntos correspondientes
porque, si superpusiéramos la retina de un ojo sobre la retina del otro, los puntos coincidirían. En general, un punto a en la
retina derecha y un punto b en la retina izquierda son puntos correspondientes cuando ambos tienen la misma posición en
su respectiva retina. No sólo son puntos corres- pondientes los que, situados en las fóveas, reciben estimulación del punto
de fijación, cada punto de una retina tiene su correspondiente punto en la otra. La estimulación de puntos correspondientes
en las dos retinas provoca fusión binocular puesto que el objeto es visto como un único objeto en el espacio a pesar de ser
dos los puntos estimulados en las retinas.
Horópter. Recibe este nombre el conjunto de puntos en el espacio visual que, dada una determinada fijación ocular,
proyectan su imagen en puntos correspondientes de las dos retinas. Hay que notar que el horópter se define en relación al
punto de fijación y por lo tanto cambia cuando cambia el punto de fijación. Aún así, desde el siglo diecisiete los
investigadores han tratado de estudiar la forma que tiene.
Desde una aproximación teórica, basada en la óptica geométrica, supo- niendo que los ojos son esferas perfectas y que
rotan en torno a ejes que solamente pasan por el punto nodal de cada ojo5, el horópter longitudinal, que se define en el
plano horizontal, está constituido por una circunferencia que pasa por el punto de fijación y por el punto nodal de cada ojo.
Esta cir- cunferencia suele conocerse como circunferencia de Vieth-Müller en honor de quienes la propusieron por primera
vez. En el plano vertical, el horópter vertical está definido por la recta perpendicular al plano de visión.
Cuando se determina empíricamente el conjunto de puntos del espacio visual que, para una determinada fijación ocular,
proyectan su imagen en puntos correspondientes de las dos retinas, los resultados muestran desviaciones sistemáticas
respecto a la posición de los puntos determinada teóricamente. La Figura
4.10 muestra con líneas discontinuas las desviaciones tanto para el
horópter longitudinal como para el vertical.
Como puede verse, el horópter vertical tiende a estar inclinado en la di-
rección de la línea de visión, alejándose del observador por encima del
punto de fijación y acercándose a él por debajo del punto de fijación. El
horópter longitudinal tampoco se ajusta a la predicción sino que tiende a
quedarse en una posición próxima a la circunferencia de Vieth-Muller
pero desviada en dirección a la línea que pasa por el punto de fijación y
es paralela a la distancia interocular6 •
Disparidad Binocular. Cuando un punto en el espacio visual no
proyecta su imagen en puntos correspondientes de las dos retinas, las imágenes del ob- jeto en cada uno de los dos ojos
resultan tanto más diferentes cuanto mayor es el desplazamiento lateral de una proyección respecto de la otra. Este des-
plazamiento relativo de las dos proyecciones recibe el nombre de disparidad binocular. El fenómeno puede hacerse
patente si repetimos el ejercicio que realizamos al estudiar el fenómeno de paralaje de movimiento. De nuevo po- demos
alinear nuestros dos pulgares con un tercer objeto más lejano que nos
sirva de punto de fijación pero esta vez lo hacemos cerrando el ojo izquierdo y apuntando con el ojo derecho. En estas
condiciones, cuando los dedos y el objeto están bien alineados, cerramos el ojo derecho y abrimos el izquierdo. Veremos
que los tres objetos han dejado de estar alineados y que los dedos se han desplazado hacia la derecha de la línea de visión,
siendo el desplazamiento del dedo más cercano mayor que el del dedo en posición intermedia. La ligera diferencia entre la
visión de la escena proporcionada por el ojo derecho y por el izquierdo está ocasionada por las distintas proyecciones que
reciben debido a la separación existente entre ellos. Si repetimos el ejercicio pero situando el punto de fijación en el dedo
más próximo a nosotros veremos que al cerrar el ojo derecho y abrir el izquierdo tanto el dedo en posición intermedia
como el objeto lejano se desplazan a la izquierda de la línea de visión y en este caso el des- plazamiento del objeto lejano
es mayor que el del dedo en posición intermedia.
El fenómeno de la disparidad binocular es parecido al fenómeno de paralaje de movimiento; de hecho fue denominado
paralaje binocular en los comienzos de la psicología experimental. No obstante se diferencian en que el desplazamiento
de la imagen en la disparidad binocular está fijado por la distancia interocular, mientras que en la clave de paralaje de
movimiento el des- plazamiento de la imagen depende de la amplitud del movimiento lateral que realice el observador.
Además, en la disparidad binocular el desplazamiento de las imágenes es simultáneo mientras que en la clave de paralaje
de movimiento el desplazamiento de las imágenes es sucesivo. Obsérvese, por tanto, que el ejemplo que estamos utilizando
de alineamiento de los dedos pulgares con un objeto alejado es, en sentido estricto, un ejemplo de paralaje de movimiento
que produce sucesivamente un desplazamiento de la imagen igual al desplaza- miento simultáneo producido por la
disparidad binocular.
La disparidad binocular puede proporcionarnos información respecto a la posición de los objetos en el espacio
tridimensional, tanto por medio del sentido del desplazamiento que produce, como por la magnitud del mismo. El sentido
de la disparidad nos informa de la posición del objeto respecto al punto de fijación. Si repetimos el ejercicio que hemos
realizado anterior- mente, de alineación de los dedos con un objeto alejado, apuntado ahora la mirada hacia el dedo situado
en posición intermedia, veremos que al cerrar el ojo derecho y abrir el izquierdo el objeto lejano se desplaza a la izquierda
de la línea de visión mientras que el dedo más cercano se desplaza a la derecha. En general, el desplazamiento de los
objetos más próximos que el punto de fijación se produce en sentido contrario al desplazamiento de las imágenes
producido por nuestro abrir y cerrar de ojos, y por ello se le da el nombre de disparidad cruzada. Por el contrario, los
objetos más alejados de nosotros que el punto de fijación se desplazan en el mismo sentido que el del desplaza- miento de
las imágenes y por ello la disparidad que producen se denomina no cruzada. La Figura 4.11 presenta la situación de
desplazamiento simultáneo de la imagen propia de la disparidad binocular.
En la figura, el punto de fijación está situado en P. Los puntos más cerca- nos al observador
que el punto de fijación, que dan origen a una disparidad cruzada, como es el caso del punto
C, producen el desplazamiento de sus pro- yecciones hacia la zona lateral de las retinas. Por
otra parte, los puntos más alejados del observador que el punto de fijación, que dan origen a
disparidad
no cruzada, como es el caso del punto F, producen el desplazamiento de sus proyecciones
hacia la zona nasal de las retinas.
Finalmente, la magnitud del desplazamiento es un indicador cuantitativo de la distancia a la
que se encuentra un objeto: a medida que un objeto se ale- ja del punto de fijación
aproximándose al observador, su disparidad cruzada aumenta, y a medida que un objeto se
aleja del punto de fijación alejándose también del observador, su disparidad no cruzada
aumenta. El aumento de la disparidad cruzada está, por tanto, asociado con una
aproximación del objeto al observador y el aumento de la disparidad no cruzada está
asociado con un alejamiento del objeto respecto al observador. Y, a la inversa, la
disminución de la disparidad cruzada está asociada con un alejamiento del objeto respecto
al observador mientras que la disminución de la disparidad no cruzada está asociada con un acercamiento del objeto al
observador.
La disparidad binocular puede producir dos efectos perceptivos diferentes dependiendo de su magnitud. Puede producir
estereoscopia o puede producir imágenes dobles que ponen en marcha un proceso de rivalidad binocular. Cuando la
disparidad es pequeña, las imágenes de los dos ojos se fusionan en una sola pero situada a una distancia del observador
diferente de la distancia que corresponde al horópter. Esta diferencia en profundidad es lo que se denomina estereoscopia.
En pocas palabras, podemos definir estereoscopia como la percepción de la profundidad producida por la disparidad
binocular. Dependiendo de la dirección de la disparidad los objetos aparecen por delan- te o por detrás del horópter
longitudinal. La disparidad cruzada produce la
percepción del objeto por delante del horópter mientras que la disparidad no cruzada produce la percepción del objeto por
detrás del horópter. En ambos casos, la dirección de la línea de visión al objeto fusionado es el promedio de las direcciones
visuales predichas a partir de las dos imágenes monoculares.
- Procedimientos estereoscópicos: La investigación de la estereoscopia ha estado relacionada con la invención y
utilización de estereogramas, que son pares de imágenes prácticamente iguales pero que difieren en el des- plazamiento
lateral de sus elementos. Cada imagen del par recibe el nombre de media-imagen. Cuando cada media-imagen estimula un
ojo diferente al mismo tiempo, la imagen fusionada produce una ineludible sensación de pro- fundidad. Los estereogramas
fueron inventados hacia 1838 por Wheatstone, que también inventó el estereoscopio, aparato que permitía la presentación a
cada ojo por separado de los componentes de un estereograma. La Figura 4.12 presenta un
ejemplo de estereograma tradicional en el que las dos me- dias-imágenes están desplazadas hacia
el exterior.
Si cada media-imagen es presentada simultáneamente a un ojo diferente8, se producirá la
segregación de la imagen fusionada en tres planos diferentes de profundidad. Los pequeños
cuadrados aparecerán por delante de los cír- culos y estos, a su vez, por delante de los cuadrados
grandes. Esta posición relativa de las figuras geométricas se debe a que el desplazamiento de las
imágenes del estereograma se ha realizado hacia el exterior (disparidad cruzada). Si el
desplazamiento hubiera sido hacia el interior, en sentido nasal (dispari- dad no cruzada), entonces
el orden de aparición de las figuras hubiera sido el inverso; primero los cuadrados grandes,
después los círculos y más alejados los cuadrados pequeños.
Hasta los años 60, se utilizaron estereogramas tradicionales como el de la Fig 4.12. Hasta
entonces se pensaba q la percepción estereoscópica de la profundidad era la consecuencia de la
disparidad retiniana del contorno y de los bordes de cada media-imagen. En consecuencia, se
pensaba tb q la percepción monocular de la forma era un requisito previo para q tuviera lugar la
fusión binocular. Para el sistema visual, el problema fundamental a resolver, q es el llamado
problema de la correspondencia, quedaba así muy simplificado.
- El problema de la correspondencia. uno de los problemas principales q tiene que resolver el sistema visual para poder
fusionar las dos imágenes monoculares es determinar qué puntos o partes de la imagen de un ojo corresponden a qué
puntos o partes de la imagen del otro ojo. Este es el llamado problema de la correspondencia. Para la concepción trad de la
estereoscopia este problema estaba relativamente simplificado pq -se suponía- la forma y los bordes de la imagen
monocular podían guiar el proceso de fusión de la imagen estereoscópica. La revolución en el estudio de la estereoscopia
se produjo cuando Julesz demostró q se podía producir estereoscopia usando estereogramas de puntos aleatorios.
- Estereogramas de puntos aleatorios. consiste en una pareja de medias-imágenes, cada una de las cuales consiste en
miles de puntos colocados aleatoriamente, cuyo desplazamiento lateral produce una fuerte sensación de profundidad
cuando las dos medias-imágenes se ven estereoscópicamente. Julesz construyó sus primeros estereogramas generando por
medio de un ordenador un patrón de puntos en una matriz bidimensional de 100 x 100. Cada celda de la matriz estaba
ennegrecida (esto generaba un punto) o se dejaba en blanco de acuerdo con una secuencia puramente aleatoria. Esta matriz
era la media-imagen de uno de los ojos, supongamos que el derecho. La correspondiente al otro ojo era idéntica a la
anterior excepto que los puntos correspondientes a una pequeña submatriz rectangular situada en el centro habían sido
desplazados una columna en sentido lateral. Este proced tiene la virtud de mantener las propiedades relacionales de los
puntos de la matriz grande inalterados mientras q proporciona a los puntos de la submatriz una disparidad retiniana
correspondiente a una columna. La visión estereoscópica de este estereograma provoca la percepción de una superficie
rectangular (la submatriz) situada a distinto nivel de profundidad q la matriz grande.
Fig 4.13 estereograma de puntos aleatorios construido en la forma que
acabamos de describir. Si se utiliza un proced de convergencia ocular
cruzada para conseguir la fusión de las imágenes, se verá un cuadrado
pequeño que se destaca por delante de un fondo formado por el resto de
puntos.
Los estereogramas de puntos aleatorios demostraron q la forma y los
bordes de la imagen monocular no son necesarios para guiar la
resolución del problema de la correspondencia. Es suficiente una mera
disparidad de puntos para que se produzca la segregación de una imagen
o de una escena en diferentes planos de profundidad. Por otra parte, estos estereogramas tb ponen de manifiesto que la
estereoscopia no es un resultado tardío en el procesa- miento de información visual, que necesite un procesamiento previo
de la forma de las imágenes monoculares. Más bien, la estereoscopia, al menos en sus primeras fases, aparece como un
proceso que tiene lugar relativamente pronto y que incluso proporciona información sobre la forma de los objetos.
- Características de la estereoscopia humana. La sensibilidad estereoscópica de nuestro sistema visual es muy grande.
La investigación experimental coincide en afirmar que, bajo las mejores condiciones perceptivas, la agudeza
estereoscópica se encuentra en el rango de los dos a los seis segundos de ángulo. También se ha encontrado que la
sensibilidad es mayor para la disparidad cruzada que para la no cruzada. Con todo, la sensibilidad estereoscópica depende
de factores espaciales tales como la excentricidad de los estímulos y la distancia entre los estímulos y el punto de fijación.
Para las dos variables, excentricidad y distancia, la sensibilidad disminuye cuando aumentan sus valores.
En el otro extremo, la magnitud de disparidad dentro de la cual se produce estereoscopia está limitada a un área en torno al
horópter que se conoce con el nombre de área de fusión de Panum. El tamaño de esta área de fusión no es igual para todo
el horópter sino que es menor en el entorno del punto de fijación que en la periferia. Es de algo menos de 10’ de ángulo
para la visión central y alcanza valores por encima de los 30’ de ángulo a partir de una distancia de unos 15º en la periferia.
Fig 4.14 muestra el área de fusión de Panum y su relación con el horópter.
Tb muestra las proyecciones de dos puntos en el horópter, uno (F) corresponde al
punto de fijación y el otro (A) se encuentra en el horópter pero proyecta fuera de la
fóvea_ Obsérvese que las proyecciones de A, que son a y a', proyectan sobre
puntos correspondientes en las dos retinas. No ocurre así con el punto B cuyas
proyecciones (by b') muestran una considerable disparidad cruzada.
La interpretación clásica del área de Panum ha considerado, siguiendo a este autor,
que el área representaba propiedades fijas de una región det de la retina. Hoy
sabemos q esta concepción es errónea pues tanto el tamaño como la forma del área
de Panum dependen tanto de las características del estímulo como del proced
utilizado para medirla. Ej: Schor, Word y Ogawa encontraron q los objetos grandes
tenían áreas mayores q los pequeños y lo mismo ocurría con las imágenes borrosas
comparadas con las más nítidas. El área de Panum presenta unas características dinámicas considerables y depende de
mecanismos perceptivos de considerable complejidad. Por tanto, las cifras que hemos dado anteriormente sobre sus
dimensiones deben tomarse sólo como una orientación referida a condiciones típicas de medición.
- Mecanismos fisiológicos de la estereoscopia. El hallazgo de neuronas en la corteza visual primaria (V1) que respondían
de forma selectiva a la disparidad binocular tuvo lugar en 1967 y se debió a las invests de Barlow, Blakemore, y Pettigrew.
Con posterioridad se han encontrado células selectivas a la disparidad en otras áreas de la corteza cerebral como V2 y V3.
Como su mismo nombre indica, estas neuronas muestran alta tasa de disparo cuando un determinado estímulo incide en
puntos de las dos retinas que no son correspondientes. Unas células responden preferentemente a niveles de disparidad
bajos, mientras que otras lo hacen a niveles de disparidad altos. De forma parecida unas responden preferentemente a la
disparidad cruzada mientras que otras lo hacen a la no cruzada. De entre las múltiples invests psicofisiológicas sobre la
estereoscopia merece la pena destacar, por su cuidadoso carácter cuantitativo, las realizadas recientemente por DeAngelis,
Cumming y Newsome en el área temporal medial (MT) de monos. Descubrieron que en esta zona existía una clara org
funcional de la estereoscopia que presentaba 3 características funds:
l. Las neuronas selectivas a la disparidad estaban organizadas en columnas de acuerdo con valores particulares de
disparidad, de forma que las neuronas que mostraban preferencia para una det disparidad binocular formaban parte de la
misma columna.
2. Las neuronas selectivas a la disparidad estaban agrupadas a lo largo de MT formando como una especie de parches
intercalados con otros que no mostraban selectividad a la disparidad.
3. Finalmente, en los parches con buena selectividad a la disparidad, la disparidad preferida variaba de forma gradual y
continua de columna a columna a lo largo de la superficie de MT
Estos resultados indicaban que el área MT contenía un mapa de disparidad binocular, pero DeAngelis y cols quisieron
comprobar que efectivamente las neuronas pertenecientes a este mapa estaban implicadas en la percepción de la
profundidad y para ello estimularon eléctricamente grupos de neuronas mientras los monos realizaban una tarea de
discriminación de la profundidad utilizando estereogramas de puntos aleatorios estáticos. El uso de estereogramas estáticos
era importante porque MT es un área que tb contiene neuronas especializadas en el procesamiento del mov. Los resultados
mostraron q la microestimulación provocaba un sesgo sistemático en los juicios perceptivos de los monos en la dirección
de la disparidad preferida por las neuronas que eran estimuladas. Por tanto, en el área MT se originan señales relevantes
para la percepción de la profundidad estereoscópica.
1.2.3. Rivalidad binocular
Hemos visto que la disparidad binocular, siempre que no sobrepase la magnitud indicada por el área de Panum, produce
estereoscopia. Cuando la disparidad es grande y sobrepasa los valores de dicha área se producen imágenes dobles aunque
por lo general la experiencia consciente de las dos imágenes, fenómeno que se denomina diplopía, no llega a producirse.
La razón de que no se produzca se debe a que las imágenes dobles provocan un fenómeno de rivalidad binocular en el que
ambas imagen parecen competir por acceder a la consciencia. Cuando los estímulos son pequeños, produciendo un ángulo
visual igual o menor a un grado, la rivalidad es total de forma que una imagen domina sobre la otra durante un periodo de
tiempo que oscila entre 1 y 4 segundos y durante ese periodo es la única imagen percibida conscientemente. Después la
experiencia consciente cambia y la imagen que antes estaba suprimida accede a la consciencia y la que se percibía es
suprimida. Así se produce una continua alternancia entre las dos imágenes que se debe probablemente a la fatiga de las
neuronas responsables de su respectiva percepción consciente. Cuando los estímulos son grandes, la rivalidad binocular
produce una imagen consciente compuesta de trozos o partes pertenecientes a cada una de las dos imágenes.
La visión binocular normal implica tanto estereoscopia como rivalidad binocular. Si en nuestra experiencia visual habitual
consciente el campo visual aparece bien unificado, es debido a la acción conjunta de los mecanismos que subyacen a estos
dos fenómenos. La estereoscopia fusiona los puntos que se encuentran dentro del área de Panum y la rivalidad binocular
resuelve la competición entre imágenes dobles.
1.3 relación entre las claves de profundiad
Hasta este momento en la exposición de este capítulo, hemos estudiado la aportación de las distintas claves de profundidad
considerando cada una de ellas de forma aislada. Obviamente en la percepción ordinaria, todas estas claves actúan de
forma conjunta integrando la información que cada una de ellas aporta para lograr una percepción consistente del espacio
tridimensional. La percepción de la profundidad está sobredeterminada por el conjunto de factores que hemos estudiado de
forma que la ausencia de una clave no es un obstáculo para que el sistema visual pueda obtener una adecuada adapta· ción
a la situación estimular tridimensional. Esta sobredeterminación es tb un indicador de la importancia que la percepción de
la tercera dimensión tiene para la supervivencia del organismo.
Cómo se lleva a cabo la integración de las distintas claves para producir la percepción de la profundidad es un tema poco
investigado aún. Las investigaciones de laboratorio han tratado de comparar unas claves con otras con el fin de observar el
resultado que las distintas manipulaciones experimentales producen en la percepción visual. Los resultados de estas
investigaciones han puesto de manifiesto que las distintas claves pueden relacionarse entre sí de tres formas diferentes:
dominancia, compromiso e interacción.
- Dominancia. Se produce dominancia de una clave sobre otra cuando el sistema visual ignora la información
proporcionada por una clave en favor de la proporcionada por otra clave de profundidad. Un ejemplo conocido que muestra
este efecto es la habitación de Ames. En esta habitación, Ames opone la información proporcionada por la perspectiva y
la proporcionada por el tamaño familiar. Se trata de una habitación distorsionada de forma trapezoidal como aparece en el
esquema de la Figura 4.15.b.
El observador sólo puede mirar dentro de la habitación a través de un orificio situado estratégicamente en una de las
paredes de la habitación. Desde ese punto de vista, la habitación parece rectangular a pesar de que no lo es. Cuando
personas de la misma estatura se colocan en distintas posiciones a lo largo de la pared del fondo, el observador
inevitablemente percibe a las personas como si estuvieran a la misma distancia y tuvieran estaturas muy diferentes (Fig
4.15.a). En el caso de esta ilusión, la percepción del observador está dominada por la información que proporciona la
perspectiva, que desde el punto de observación predeterminado hace parecer la habitación como rectangular. A pesar de
que el tamaño familiar debería igualar el tamaño de las personas, esta información es ignorada y el tamaño de las personas
queda determinado por el tamaño de la imagen proyectada en la retina, provocando así la ilusión de tamaño que caracteriza
a la habitación de Ames.
- Compromiso. No siempre se produce el predominio de una clave respecto de otra. A veces, la resultante del conflicto
entre las informaciones proporcionadas por las distintas claves es un valor intermedio entre los valores de profundidad
proporcionados por cada clave. Por ejemplo, Bruno y Cutting manipularon valores de cuatro claves diferentes: tamaño
relativo, posición respecto al horizonte, oclusión y paralaje de movimiento. Construyeron diferentes estímulos que
combinaban los valores de esas claves y solicitaron a los participantes que para cada estímulo evaluaran en una escala de O
a 99 la magnitud de la profundidad percibida. Encontraron que el grado de profundidad percibida era el resultado de sumar
la información proporcionada por cada una de las claves. En este caso, por tanto, los observadores no se guiaban por una
clave ignorando las otras, como ocurre en los casos de dominancia, sino que integraban la inf de las claves de acuerdo con
una simple regla aditiva. Parece como si la inf proporcionada por cada clave fuera independiente de la información
proporcionada por las otras y el resultado final se produjera sin ningún tipo de interacción entre las claves.
- Interacción. aunq el compromiso actúa en algunas ocasiones, no puede descartarse la existencia de interacciones entre la
inf proporcionada por las distintas claves. En el caso de las claves que solamente producen inf relativa sobre la
profundidad, parece lógico pensar que necesitan interactuar con alguna clave que proporcione información absoluta sobre
la distancia a la que se encuentran los objetos para poder dar lugar a un mapa métrico de profundidad. Ej: piénsese en la
disparidad binocular que es una potente clave de profundidad pero solamente de profundidad relativa respecto al punto de
fijación. Considerada de forma aislada la disparidad binocular no proporciona información absoluta de la distancia a los
objetos sino que informa sobre las proporciones entre las distancias de los objetos situados en diferentes planos de
profundidad. Piénsese también en la convergencia que proporciona información sobre la distancia absoluta pero
únicamente de la distancia al objeto que se encuentra en el punto de fijación. La interacción de estas dos claves permite
generar un mapa métrico de la profundidad de los objetos en la escena ya que la convergencia binocular proporciona el
valor de distancia real a que se encuentra el objeto en el que se fija la vista, y a partir de esta medida se pueden escalar las
proporciones de disparidad de profundidad relativa. De esta forma el sistema visual puede conseguir las distancias
absolutas a todos los objetos de la escena.
La invest de la integración entre claves de profundidad casi se ha limitado a constatar q existen los 3 tipos de procesos q
hemos visto. Aún sabemos muy poco sobre las condiciones q determinan el predominio de un proceso sobre los otros
2. TEORÍAS DE LA PERCEPCIÓN ESPACIAL
2 aproxs teóricas han determinado la invest sobre percepción espacial en psicología. Las diferencias responden a
discrepancias profundas respecto a los procesos perceptivos en general, su confrontación más clara está en el terreno de la
percepción espacial. Son la de aproximación constructivista y la aproximación ecológica. Estudiaremos el modo en que
cada una de ellas aborda la explicación de un fenómeno relacionado con la percepción de la distancia como es la
constancia del tamaño.
2.1 La aproximación constructivista
Es la más antigua de las dos y, aunque hunde sus raíces en el empirismo filosófico, suele considerarse a Helmholtz como
padre de la primera formulación científica de la misma. Dp otros investigadores, como Boring, Epstein, Hochberg y Rack
entre otros, han contribuido a reformular las ideas centrales que caracterizan esta concepción. Aquí nos centraremos en el
estudio de estas ideas centrales sin prestar especial atención a los matices q diferencian a los distintos autores.
Una idea central de la aprox constructivista es que la percepción tiene lugar por fases que se complementan unas a otras y
que de forma conjunta contribuyen a proporcionar la información necesaria. Inicialmente, la inf proporcionada por la
imagen retiniana o estímulo próximo no es adecuada para determinar por sí sola la percepción. El estímulo próximo es
ambiguo y necesita la aportación de información por parte de otros procesos psicológicos, tales como el aprendizaje y la
memoria, para resolver esa ambigüedad y proporcionar una percepción adecuada al estímulo distante. En el caso del
espacio tridimensional, como la retina es una superficie bidimensional, la percepción de un espacio tridimensional no
puede ser un fenómeno perceptivo primario sino derivado a partir de la imagen retiniana bidimensional. De ahí la
importancia que para la aprox constructivista tiene el análisis de las claves de profundidad que hemos estudiado. Las claves
de profundidad actúan como un contexto interpretativo que nos permite recuperar las caracs tridimensionales del E distante
a partir del núcleo de información proporcionado por la imagen retiniana bidimensional. La forma en q la concepción
constructivista explica la constancia del tamaño, nos ayudará a concretar el conocimiento de esta forma de pensar.
- La constancia del tamaño
Recordemos las relaciones geométricas que se han explicado en la Fig 3.8 entre el tamaño de los objetos, su distancia
respecto al observador, el ángulo visual y el tamaño de la imagen retiniana. Allí veíamos que el ángulo visual, y por
consiguiente el tamaño de la imagen retiniana, varía directamente con el tamaño del objeto e inversamente con la distancia
a la que se encuentra el objeto. A igual distancia, cuanto mayor es un objeto mayor es el ángulo visual que su imagen
proyecta en la retina. Por otra parte, el ángulo visual proyectado por un objeto disminuye a medida que el objeto se aleja
del observador.
Si la percepción del tamaño de un objeto estuviera determinada por el tamaño del ángulo visual, los objetos variarían en
tamaño percibido cuando variase su distancia al observador. Esto es lo que ocurre cuando la distancia respecto a los objetos
percibidos es muy grande. Por ejemplo, si contempla- mos el tráfico de una ciudad desde un edificio muy alto, podemos
tener la impresión de que el tamaño de los coches es el equivalente al de coches de juguete. Sin embargo, cuando la
distancia de los objetos al observador no es muy grande, el desplazamiento en profundidad de los objetos no provoca un
cambio en su tamaño percibido a pesar de que el ángulo visual que proyectan disminuye. Por ejemplo, si el lector está en
una habitación, puede observar que el tamaño percibido de un objeto cercano no varía al trasladarlo al extremo más alejado
de la habitación a pesar de la innegable reducción que el aL ángulo visual experimenta. Este fenómeno es el que se conoce
con el nombre dis de constancia del tamaño. De alguna forma el sistema visual compensa la disminución del ángulo
visual de forma que la consciencia visual del observador la mantiene una experiencia constante del tamaño del objeto.
Para estudiar la constancia del tamaño de una forma controlada, se han realizado muchos experimentos en los que los
participantes tienen que comparar el tamaño de objetos a diferentes distancias. La Fig 4.16 presenta de forma esquemática
los resultados típicos de este tipo de experimentos. En la figura se representa el tamaño percibido en función de la distancia
a la que se sitúa el objeto variable. Como puede verse, el tamaño aparente no disminuye en función de la distancia de
acuerdo con la variación que experimenta el tamaño de la imagen retiniana, sino que se aproxima mucho más a la curva
teórica de constancia.
- Tomar en consideración la distancia
La explicación constructivista de la constancia del tamaño ha puesto siempre el énfasis en que el sistema visual evalúa el
tamaño de un objeto basándose no sólo en el tamaño del ángulo visual o tamaño de la imagen retiniana sino también en la
distancia a que el objeto se encuentra situado. Helmholtz fue el primero en postular que el sistema visual tomaba en
consideración la distancia a la que se encontraba un objeto por medio de una inferencia inconsciente. Según Helmholtz, el
sistema visual primero registra el tamaño de la imagen retiniana y después modifica esta información de acuerdo con la
información disponible acerca de la distancia a la que se encuentra el objeto. Para Helmholtz esta operación tenía lugar de
forma inconsciente, sin que el observador cayera en la cuenta de la misma.
La formulación moderna de esta misma idea se conoce con el nombre de hipótesis de la invarianza tamaño-distancia,
que se limita a suponer que la imagen retiniana guarda la misma relación con el tamaño y la distancia percibidos que con el
tamaño y la distancia fisicos. Si el ángulo visual (a) proyectado por un objeto sobre la retina es directamente proporcional
al tamaño del objeto (h) e inversamente proporcional a la distancia (d) a la que el objeto está, podemos establecer q:
La hipótesis de la invarianza tamaño-distancia supone que la imagen retiniana guarda la misma relación
con el tamaño percibido (hP) y la distancia percibida (dP) de modo que:
Es decir, el tamaño percibido es igual a la distancia percibida multiplicada por la tangente del ángulo visual. Dicho en otros
términos, el tamaño percibido es igual al producto de la distancia percibida por el tamaño de la imagen retiniana. En una
situación cotidiana, a medida que un objeto se aleja del observador, el ángulo visual producido por el objeto disminuye
pero el tamaño percibido permanece constante debido a la relación expresada en la ecuación
- evidencia a favor de la hipótesis de la invarianza tamaño-distancia:
la ley de eEmmert: La relación que acabamos de ver entre tamaño y distancia percibidos y tama- ño de la imagen retiniana
predice que, si el tamaño de la imagen retiniana permanece constante, entonces el tamaño percibido es proporcional a la
dis- tancia percibida. La comprobación de esta predicción no es fácil porque todo cambio en la distancia a la que se
encuentra un objeto conlleva un cambio en ángulo visual y por tanto en el tamaño de la imagen retiniana. Sin embargo
existe un fenómeno perceptivo que permite mantener constante el tamaño de la imagen retiniana y cambiar la distancia a la
que se percibe un objeto. Se trata del fenómeno de las posimágenes que ya hemos visto en capítulos anteriores.
Observe la Fig 4.17 y fije su vista en el círculo negro del marco izquierdo
durante 30’’. Dp cambie su vista al cuadrado de la derecha, fije su vista en
el punto central y percibirá un círculo del mismo tamaño que el anterior
pero de color blanco intenso. Debido a la prolongada exposición al
estímulo negro, su visión ha perdido sensibilidad a ese color y ha
aumentado la sensibilidad para el color oponente, el blanco. Repita ahora
la observación del círculo negro de la izquierda y, después de 30’’, fije su
mirada en alguna superficie blanca lejana como puede ser una pared de la
habitación en que se encuentra. Observará que sobre esa superficie se proyecta un círculo blanco de mayor tamaño que el
que vio anteriormen- te en la parte derecha de la Fig 4.17. Si tiene la oportunidad de repetir la experiencia con superficies
de proyección situadas en distintos planos de profundidad desde su posición de observación, comprobará que el tamaño del
círculo proyectado en la posimagen aumenta a medida que la superficie sobre la que se proyecta está más alejada de usted.
Esta experiencia ilustra la ley enunciada por Emmert en 1881 que establece que el tamaño aparente de una posimagen es
directamente proporcional a su distancia percibida desde el observador.
La ley de Emmert expresa un hecho que se refiere a la variación en tamaño percibido con el cambio de la distancia. Es el
fenómeno opuesto a la situación normal en la que un cambio en distancia va acompañado de una constancia en el tamaño
percibido. Sin embargo, ambas experiencias son la expresión de un mismo principio. Si el sistema visual se comporta
como una calculadora que multiplica el tamaño retiniano por la distancia percibida para producir el tamaño percibido,
entonces cuando el ángulo visual decrece al aumentar la distancia el producto resultará en la constancia del tamaño. Sin
embargo, cuando el ángulo visual permanece constante y se aumenta la distancia, el tamaño aparente aumentará como
indica la ley de Emmert para las posimágenes.
percepción del tamaño e indicadores de profundiad: Una forma de estudiar el papel que la distancia aparente juega en la
percepción del tamaño consiste en estudiar la relación entre esta percepción y los indicadores de profundidad que hemos
estudiado. Holway y Boring realizaron una serie de experimentos, que aún hoy se consideran clásicos en este tema, y que
proporcionaron interesante información sobre esa relación. En la situación experimental ideada por Holway y Boring, el
observador estaba situado en la intersección de dos largos pasillos que se extendían en forma de L. En uno de los pasillos
había un disco de luz que era ajustable en tamaño y que se colocaba a una distancia fija del observador (unos tres metros).
El observador tenía el control del tamaño de este disco. En el segundo pasillo se colocaba otro disco de referencia y, en
cada ensayo, se variaba la distancia, entre 3 y 36,5m, a la que era presentado. Lo peculiar respecto a este segundo disco
consistía en que su tamaño era elegido por el experimentador en cada ocasión de forma que el ángulo visual q proyectaba
sobre la retina fuera siempre de un grado de ángulo visual. Así el E próximo en todas las condiciones experimentales era el
mismo. La tarea del observador consistía en ajustar el tamaño del primer círculo hasta q le pareciese igual al círculo de
referencia. Holway y Boring estudiaron la ejecución de los sujetos bajo las siguientes condiciones de observación visual:
a) visión binocular normal; b) visión monocular; e) utilizando una pantalla de reducción, que es simplemente una pantalla
opaca con una apertura por la que el observador mira con un solo ojo, y d) en una condición similar a la anterior pero
eliminando aún más los posibles puntos de ref mediante la utilización de telas y colgantes oscuros a lo largo del pasillo.
Obsérvese que en esta situación experimental las relaciónes entre ángulo visual, tamaño aparente y distancia son
semejantes a las de la posimagen que hemos comentado al hablar de la ley de Emmert. En el experimento de Holway y
Boring el ángulo visual proyectado por el estímulo de referencia, y
por tanto la imagen retiniana, se mantenía constante. En
consecuencia, si los sujetos percibían constancia en el tamaño,
hubieran tenido que aumentar el disco de ajuste de la misma forma
que los experimentadores aumentaban el tamaño del disco de ref.
Por otra parte, si la degradación de los indicadores de distancia era
perfecta, y la única información que los observadores recibían era la
proporcionada por el ángulo visual, su ajuste hubiera debido
mantenerse constante a lo largo del experimento. Cualquier
condición de degradación de las claves que no fuera perfecta pero
deteriorase la estimación de la distancia, hubiera tenido que
producir ajustes intermedios entre los dos anteriores.
Fig 4.18 muestra los resultados experimentales de Holway y
Boring. Como puede observarse, bajo las condiciones de observación a) y b) el ajuste efectuado estaba próximo al
necesario para mantener la constancia en el tamaño aparente, e incluso la condición a) tendía a exagerar ligeramente el
ajuste. En la condición e) el aumento del disco de ajuste, a medida que aumentaba la distancia del disco de referencia, era
mucho menor que en las condiciones a) y b). En la condición d), en la que la degradación de las claves de distancia era
mayor, la tendencia presente en e) se acentuaba aún más y la función se aproximaba a la constancia típica de una situación
en la q el único indicio disponible para el observador era el ángulo visual.
En otros experimentos q se realizaron dp de los de Holway y Boring, en los q se controló más cuidadosamente la supresión
de los indicadores de distancia producidos por la pantalla de reducción, se llegó a obtener una función constante de acuerdo
con el tamaño del ángulo visual.
Aunq los resultados experimentales q acabamos de comentar ponen de manifiesto la importancia que tiene la consideración
de la distancia en la percepción del tamaño, otros experimentos han mostrado también que, a la hora de juzgar el tamaño de
los objetos, las personas pueden tomar en consideración varios factores diferentes. Por ejemplo, se ha puesto de manifiesto
que las instrucciones respecto al punto de referencia que el observador debe adoptar para emitir sus juicios, pueden influir
en la percepción del tamaño. Gilinsky realizó un experimento en el que presentó a los participantes un triángulo de
referencia a diferentes distancias. Les pidió que ajustaran el tamaño de otro triángulo de acuerdo con el tamaño percibido.
La manipulación fundamental que Gilinsky introdujo fue las instrucciones bajo las que los observadores realizaron la tarea.
Unas instrucciones, que llamaremos objetivas, solicitaban el ajuste del triángulo variable de forma que igualara el tamaño
del triángulo de referencia como si ambos fueran medidos con una regla. Otras instrucciones, que llamaremos retinianas,
pedían a los observadores imaginar que se tomaban fotografías de los dos triángulos y, por lo tanto, si un triángulo era más
distante que otro, produciría una imagen más pequeña. Los resultados mostraron que bajo instrucciones retinianas, el
tamaño del triángulo variable disminuía a medida que aumentaba la distancia del triángulo de referencia. Sin embargo, bajo
instrucciones objetivas tendían a exagerar la constancia del tamaño. Este fenómeno, que también Holway y Boring
encontraron en el experimento expuesto anteriormente, se ha denominado sobreconstancia y ha sido replicado en
numerosas ocasiones. Una explicación general bastante aceptada de este fenómeno es que bajo instrucciones objetivas la
respuesta del observador está mediada por procesos cognitivos de cálculo e inferencia que llevan a sobreestimar la
constancia, mientras que bajo instrucciones retinianas el juicio no está influido por estos factores cognitivos sino que es de
naturaleza más directamente perceptiva. Lo expuesto hasta ahora ilustra de forma bastante extensa cómo se ha llevado a
cabo la investigación de la constancia del tamaño desde una perspectiva constructivista y el valor de una explicación de
esta constancia mediante la toma en consideración de la distancia percibida.
2.2. La aproximación ecológica
o también percepción directa. Formulado por Gibson y entiende la percepción en oposición a la postura constructivista.
Para Gibson, el planteamiento clásico del problema de la percepción tridimensional, consistente en buscar claves de
profundidad en la superficie bidimensional de la retina, está equivocado. La investigación perceptiva debe tomar en
consideración el patrón total de estimulación, no la proyección geométrica de aspectos parciales del estímulo en la retina.
La ambigüedad del estímulo, que es para los constructivistas un supuesto fundamental, es fruto de un análisis inadecuado
del patrón total de estimulación y no de una insuficiencia del patrón para determinar la percepción.
Gibson pensaba q la óptica geométrica no era el instrumento adecuado para describir el estímulo y las rels entre medio
ambiente y patrón de estimulación. En su lugar, trató de crear una óptica ecológica cuyo principio fundamental es que la
luz del medio ambiente transmite, no sólo energía, sino tb información, que es más importante. La luz puede dar inf porque
está estructurada de una forma det en cada uno de los múltiples puntos de vista q el medio ambiente ofrece al observador.
Para Gibson el concepto de información está íntimamente ligado al de estructura. La estructuración de la luz en un punto
de vista concreto consiste en el conjunto de perspectivas de los objetos que el observador es capaz de captar desde ese
punto de vista, incluyendo también las perspectivas cambiantes de los objetos que se mueven. Gibson siempre pensó que la
estimulación que continuamente llega a nuestros sentidos es muy rica en inf y proporciona continuamente de forma
suficiente todo lo necesario para que se produzca la percepción.
Para Gibson, por tanto, el estímulo carece de ambigüedad. Toda la inf está presente en la estimulación o, como Gibson
prefiere llamarla, la conformación óptica (optic array). En consecuencia, no es necesario recurrir a procesos constructivos
de carácter no perceptivo, tales como memoria o aprendizaje, para entender o explicar la percepción. La percepción para
Gibson es directa en cuanto q consiste sencillamente en captar la inf disponible en la conformación óptica. Ninguna
secuencia de procesos es necesaría para construir una representación de los objetos. Lo único necesario para percibir es
atender a la información que está en el medio ambiente.
En resumen, la teoría de Gibson es ecológica en cuanto que pone el acento en la riqueza informativa de la estimulación
ordinaria por oposición a la estimulación propia de las situaciones experimentales que, por lo general, restringen la inf. En
una situación estimular propia de la vida cotidiana la totalidad del patrón de estimulación especifica de forma necesaria y
suficiente lo q un observador percibe. La teoría de Gibson es una teoría de la percepción directa porque refiere todo lo
percibido a la inf proporcionada por la estimulación. Evita toda ref a procesos no perceptivos que puedan completar o
interpretar un posible estímulo ambiguo. La inf presente en los estímulos nunca es ambigua. Por eso, la tarea de los
psicólogos que estudian la percepción debe ser analizar a fondo la estimulación hasta dar con la inf particular que
determina un fenómeno perceptivo.
La constancia del tamaño desde una perspectiva ecológica
Para Gibson, explicar las constancias perceptivas no es otra cosa que descubrir en la estimulación la inf invariante que
determina la percepción de esa constancia. No acepta ningún tipo de inferencia inconsciente o proceso mental llevado a
cabo por el observador que complemente la inf proporcionada por la estimulación.
En el caso de la constancia del tamaño, no considera necesario que el observador tome en consideración la distancia
percibida, sino que es el gradiente de densidad de textura el que proporciona la escala absoluta de distancia que va a
explicar la constancia. Para Gibson, la percepción del tamaño de los objetos es una función de la cantidad de textura que el
objeto oculta al observador. Los elementos de la textura de una superficie que son ocultados por los objetos, proporcionan
una escala efectiva de tamaños con respecto a la cual puede percibirse el tamaño de un objeto. Siempre que dos objetos
oculten la misma cantidad de elementos de la textura de una superficie, se percibirán como iguales en tamaño. La Fig 4.19
puede ilustrar la idea central de la explicación de Gibson.
El suelo, y su correspondiente gradiente de textura, que se hace más denso a medida que aumenta la distancia, es la escala
respecto a la cual se valora el tamaño de los objetos. Los objetos se perciben como iguales en tamaño, a pesar de la
distancia, porque cada uno de ellos oculta la misma cantidad de textura. La relación entre el tamaño del objeto y la cantidad
de elementos de textura ocultados por el objeto no cambia y es este invariante el responsable de la constancia del tamaño.
- resultados experimentales El tipo de experimentación que Gibson aduce en favor de su teoría ha consistido en
demostrar la constancia del tamaño en situaciones fuera del laboratorio y poco propicias a facilitar los cálculos que supone
la teoría constructivista. Ej: en uno de sus experimentos colocó estacas a distintas distancias del observador en un campo
de unos 800m de largo. La altura de las estacas podía variar entre 39 y 257 cm. La tarea de los observadores consistía en
escoger, de entre un conjunto de estacas graduadas que tenía detrás, aquella que más se aproximara a la que en cada ensayo
tenía que estimar. En estas condiciones, y sobre todo para las distancias más alejadas, el tamaño de la imagen retiniana es
tan pequeño que el cálculo del tamaño percibido, tal como propone la teoría constructivista, resulta prácticamente
imposible. A pesar de ello, Gibson encontró que los observadores mantenían la constancia del tamaño incluso en los casos
en que las estacas estaban más alejadas. A partir de datos como estos, Gibson concluyó que la explicación de la constancia
del tamaño no necesita complicados cálculos basados en la distancia percibida sino que es mucho más simple suponer que
los observadores prestan atención a la cantidad de elementos de la textura del terreno que cada objeto cubre y que
responden directamente a esta característica.
Aunque no cabe duda de que la explicación de la constancia del tamaño que Gibson propone, resalta un aspecto importante
del problema, no parece que pueda adoptarse como una explicación general del fenómeno. Para que la oclusión de la
textura pueda informar sobre el tamaño relativo de los objetos, se necesitan unas condiciones bastantes restrictivas que por
lo general no se dan en la percepción ordinaria. Ej: es necesario que los objetos cuyos tamaños se van a comparar se
presenten sobre la textura de la misma superficie. Si no es así, o si la superficie no presenta una marcada textura, no es
posible establecer una comparación entre los objetos. Además, los elementos que componen la textura de la superficie
sobre la que están situados los objetos, deben ser del mismo tamaño. Si la textura es irregular, con unos elementos mayores
que otros, no es posible percibir constancia del tamaño sobre la base del número de elementos que los objetos ocultan. En
la percepción ordinaria es frecuente que estas condiciones no se cumplan, sin embargo el fenómeno de constancia del
tamaño sigue produciéndose.
En resumen, no parece que las relaciones q Gibson descubrió entre el tamaño de los objetos y la oclusión de la textura de la
superficie sobre la q los objetos aparecen, sea una explicación general del fenómeno de constancia del tamaño. Hay q
considerar otros fs entre los q probablemente están la distancia percibida que tanto ha interesado a los constructivistas.
En esta sección del capítulo, no pretendemos estudiar a fondo todos los problemas relacionados con la constancia del
tamaño. Más bien, hemos uti- lizado la polémica suscitada en torno a la constancia del tamaño como un ejemplo concreto
que nos ha permitido entender la forma en que las dos prin- cipales teorías de la percepción del espacio tratan de explicar
un fenómeno perceptivo. De este modo es posible entender mejor las teorías mismas. Ahora nos interesa volver sobre esas
teorías para preguntarnos si son necesariamente tan antagónicas como a veces son presentadas en los textos de psicología
de la percepción.
3. POSIBLE RECONCILIACIÓN
Son muchos los investigadores de la percepción que han considerado muy importante conseguir armonizar las dos posturas
que acabamos de exponer. Neisser propuso la existencia de tres sistemas perceptivos diferentes. Un sistema especialmente
dedicado al control de la acción del organismo en el medio ambiente. Un segundo sistema especializado en la
discriminación e identificación de objetos y situaciones familiares. Y un tercer sistema encargado de la percepción
interpersonal, de las situaciones de interacción social con otros seres humanos.
El primero de los sistemas propuestos por Neisser presenta unas caracte- rísticas similares a las que Gibson propuso para el
sistema perceptivo visual en general. Y el segundo tiene unas características similares a las que los cons tructivistas han
propuesto como propias de la percepción visual. Si la propuesta de Neisser fuera correcta nos encontraríamos con que las
dos teorías, q estamos estudiando en este capítulo, podrían tener razón, en cuanto que cada una de ellas estaría acentuando
las características propias de uno de los sistemas de percepción visual. Ambas teorías, a su vez, estarían equivocadas en
cuanto q pretenden generalizar para un único sistema de percepción visual las caracs propias de uno de los subsistemas.
Obsérvese que la propuesta de Neisser no carece de antecedentes en la historia de la investigación perceptiva. En el
capítulo sobre el color veíamos que durante casi un siglo la teoría tricromática y la teoría de los procesos oponentes
pugnaron por prevalecer en la explicación de la percepción del color. Durante ese tiempo todos los investigadores se veían
más o menos impelidos a elegir entre una u otra teoría. Hoy existe un acuerdo general sobre la validez de ambas teorías. El
problema se resolvió cuando se pudo establecer que en el procesamiento del color había varias fases y que, mientras que la
teoría tricromática tenía razón al describir el procesamiento en el nivel de los receptores, la teoría de los procesos
oponentes la tenía si se tomaba en consideración el tipo de procesamiento que tenía lugar en las células ganglionares y en
el núcleo geniculado del tálamo. ¿Hay razones para pensar que en el caso de la percepción del espacio podemos estar en
una sit semejante? ¿Hay razones para pensar que el sistema visual procesa la inf espacial de forma diferente dependiendo
de que el acto perceptivo vaya dirigido al control de la acción o a la discriminación e identificación de los objetos?
Joel Norman, de la Universidad de Haifa en Israel, ha propuesto recientemente (2002) que las vías visuales dorsal y
ventral, que la fisiología ha descrito, corresponden a dos sistemas visuales con características similares a los postulados por
Neisser, de forma que la vía dorsal formaría un sistema especializado en el control visual de la conducta motora, mientras
que la vía ventral sería un sistema preferentemen- te dedicado al reconocimiento e identificación de los objetos. Norman ha
elaborado también de forma articulada el paralelismo entre la aproximación ecológica y el funcionamiento del sistema
visual dorsal, por una parte, y, por otra parte, el de la aproximación constructivista y el funcionamiento del sistema visual
ventral. En la última parte de este capítulo nos detendremos a exponer con un poco más de detalle la propuesta de Norman.
3.1. Los sistemas visuales dorsal y ventral
Ungerleider y Mishkin (1982) fueron los primeros investigadores que pre- sentaron evidencia experimental a favor de la
existencia de dos vías funcio- nalmente diferenciadas en la corteza visual del mono. La vía ventral que pro- yectaba desde
la corteza occipital hasta la corteza temporal inferior, y la vía dorsal que proyectaba también desde la corteza occipital
hasta la corteza pa- rietal posterior. La lesión de la corteza temporal inferior izquierda del mono, le incapacitaba para
discriminar entre objetos sobre la base de la forma. Por otra parte, la lesión de la corteza parietal posterior izquierda
impedía que los animales discriminaran sobre la base de la posición. Ungerleider y Mis- hkin sugirieron que la vía ventral
era una vía preferentemente dedicada a la discriminación e identificación de objetos, mientras que la vía dorsal estaba
especializada en la localización de los mismos. A partir de entonces ha sido frecuente llamar a las dos vías visuales la vía
del <<que» y la vía del <<donde» para referirse a la vía ventral y a la dorsal respectivamente.
Desde la propuesta inicial de Ungerleider y Mishkin, la investigación tan- to con personas como con monos ha obligado a
reinterpretar la función de las dos vías. Una de las reinterpretaciones que mayor influencia tiene en la actualidad es la
propuesta por Milner y Goodale (1995). Para estos autores, tanto la vía ventral como la vía dorsal procesan información
sobre las caracte- rísticas de los objetos y sobre sus relaciones espaciales. Lo que diferencia a las dos vías es el uso que
hacen de esa información. La vía ventral se especializa en el procesamiento de las características permanentes de los
objetos y de sus relaciones, permitiendo así la formación de representaciones perceptivas a largo plazo. Estas
representaciones cumplen una función básica para poder identificar los objetos y para poder clasificarlos. La finalidad
primaria del procesamiento que tiene lugar por esta vía es la acumulación de conocimiento acerca de los objetos que nos
rodean.
A su vez, el procesamiento que tiene lugar en la vía dorsal tiene que ver preferentemente con la inf cambiante momento a
momento acerca de la localización y de la disposición de los objetos con respecto a los efectores que el sujeto utiliza. Su
función básica tiene que ver con el control visual online de las habilidades motoras, como pueden ser, por ejemplo, los mo-
vimientos de la mano a la hora de alcanzar o coger un objeto. Este sistema dorsal puede considerarse como una extensión
cortical de los módulos que controlan los movimientos guiados visualmente en los vertebrados y que im- plican estructuras
subcorticales tales como los colículos superiores y el núcleo pulvinar del tálamo.
La Figura 4.20 presenta un esquema de las estructuras
corticales princi- palmente implicadas en cada una de las
dos vías en el cerebro del mono. A partir de V1, la vía
ventral incorpora a V4 y termina en las zonas temporales
TE y TEO, mientras que la vía dorsal se encamina hacia la
corteza parietal implicando zonas temporales mediales
como MT y MST y las zonas parietales posteriores.
Milner y Goodale han proporcionado gran cantidad de
información expe- rimental a favor de la diferenciación
funcional de estos sistemas. Experimentos con ratas y
monos han mostrado una clara disociación entre los dos
sistemas.
Sin embargo, nos vamos a detener en la exposición de
ejemplos tomados de la neuropsicología humana q nos
permitirán entender la forma en que la disociación de los
sistemas que ahora estudiamos se manifiesta en las
personas.
3.2. Las disociaciones neuropsicológicas
En la investigación neuropsicológica, a la hora de hacer inferencias sobre los mecanismos responsables de una determinada
disfunción, es conveniente dis- tinguir entre dos tipos de disociaciones funcionales posibles. En el caso de la disociación
simple, lo que se observa en los pacientes18 con un daño cerebral concreto es una deficiencia en un tipo de tarea
determinada cuando su ejecu- ción se compara con un grupo de control formado por personas sin ese daño cerebral.
Además, para establecer la existencia de una disociación simple es necesario utilizar una tarea de control en la que el grupo
de pacientes y el de control no difieran. Este requisito es el mínimo requerido para asegurar que la disfunción es específica
al daño y no el resultado de una deficiencia generalizada producida por el mismo. Por ejemplo, la Figura 4.2l.A ilustra el
caso que ahora estamos tratando. En ella se compara un paciente o grupo de pacientes con daño en la zona occipito-
parietal, con un grupo de control en dos tareas, una de carácter perceptivo y otra de coordinación visomotora. Los
resultados probablemente mostrarán que los grupos no difieren en la tarea perceptiva pero sí en la tarea de coordinación, en
la que el grupo de pacientes será inferior al grupo de control.
Las disociaciones simples nos pueden poner en la pista de una
determi- nada asociación entre un área determinada del cerebro y una
función psico- lógica concreta. Sin embargo, la disociación simple no
puede establecer de forma clara la existencia de esa asociación. La
razón fundamental para ello es que tiene problemas de interpretación
inevitables. Uno de los más impor- tantes radica en el supuesto de que
las dos tareas son igualmente sensibles a las diferencias entre el grupo
de pacientes y el grupo de control. Este supues- to suele fallar en
muchas ocasiones porque no es fácil igualar las tareas en nivel de
dificultad o en grado de sensibilidad para los dos grupos. Por ejem-
plo, la tarea de coordinación visomotora puede requerir mayor
capacidad de concentración que la perceptiva. Si el daño en la zona
parietal posterior produce una deficiencia en concentración, los
pacientes pueden mostrar un patrón de ejecución semejante al de la
Figura 4.2l.A, pero no debido a un problema específico de
coordinación sino debido a un problema más general de
concentración.
Los problemas interpretativos que presenta la disociación simple
quedan prácticamente resueltos si se logra establecer una disociación
doble. En el caso de la disociación doble es necesario encontrar un paciente o grupo de pacientes que presente un patrón de
disociación opuesto al encontrado en el primer grupo de pacientes. La Figura 4.2l.B ilustra el caso de disociación doble que
ahora nos interesa tratar. En la figura vemos que el nuevo grupo de pacientes con lesiones en la zona occipito-temporal, no
difiere de los con- troles en la tarea de coordinación pero sí en la perceptiva. En resumen, en un caso de disociación doble,
la comparación de los dos grupos de pacientes añade evidencia a favor de la especificidad de la disfunción ya que en la
tarea en la que el primer grupo fracasa, el otro no difiere de los controles y, al revés, donde fracasa el segundo grupo, el
primero no presenta deficiencia alguna.
Ahora podemos preguntarnos si de hecho existe una doble disociación entre grupos de pacientes con lesiones en la vía
ventral, pero no en la vía dor- sal, y pacientes con lesiones en la vía dorsal, pero no en la vía ventral, cuando comparamos
su ejecución en tareas perceptivas y en tareas de coordinación visomotora. La respuesta es afirmativa.
- Percepción sin coordinación visomotora
Es un hecho bien conocido en la literatura clínica neuropsicológica que los pacientes con daño en la corteza parietal
posterior pueden presentar proble- mas para dirigir visualmente acciones tales como coger un objeto o dirigir un
movimiento hacia una posición determinada del espacio. El término ataxia óptica es el utilizado para describir este tipo de
deficiencia. Los pacientes con problemas de ataxia óptica, sin embargo, no suelen presentar problemas para describir la
posición relativa de los objetos en el espacio. Por eso, no parece que la deficiencia tenga que ver con la percepción del
espacio en sí misma sino con la interacción visomotora.
Algunos de estos pacientes son también incapaces de girar sus manos para alcanzar un objeto o de acertar con la apertura
adecuada de sus dedos cuan- do tratan de coger un objeto. A pesar de ello, son perfectamente capaces de describir el
tamaño de esos objetos o su orientación. De nuevo, el problema no reside en describir el tamaño o la orientación sino en
utilizar de forma adecuada la información. Estos síntomas también muestran que el problema no está exclusivamente
ligado al espacio sino que afecta a otras características de los objetos como son su tamaño, forma y orientación.
Además de presentar una clara disociación entre una percepción preserva- da y una coordinación alterada, los problemas de
coordinación, que pueden presentar los pacientes con daño parietal posterior, también presentan un alto grado de
disociación entre sí. Algunos pacientes son incapaces de utilizar información visual para controlar la postura de sus manos
pero no presentan problema alguno a la hora de controlar la dirección en que inician un movi- miento de alcance de un
objeto. Otros pacientes presentan el patrón opuesto. Algunos pacientes no son capaces de dirigir la mirada hacia un objeto
de forma precisa pero no tienen problema en calibrar la apertura de sus dedos al intentar cogerlo. Otros pueden no tener
problemas oculomotores concretos pero son incapaces de guiar visualmente su mano hacia un objeto. En general, existen
buenas razones para pensar que los mecanismos de control motor están altamente especializados Qeannerod, 1997) pero
ahora nos basta con acentuar la fuerte disociación que estos pacientes muestran entre el daño de una coordinación
visomotora determinada y la preservación de la percepción visual de la información que debería guiar la acción.
- Coordinación visomotora sin percepción
El lado contrario de la doble disociación ha tardado más en ser detectado pero está hoy bien documentado gracias a las
investigaciones de Milner, Goodale y colaboradores. Particularmente interesante es el caso de la paciente DF que vamos a
analizar con más detalle.
DF es una mujer que, a la edad de 34 años, sufrió un daño cerebral irrever- sible como consecuencia de un casi total
envenenamiento por inhalación de monóxido de carbono. Después de recobrar el conocimiento, DF era incapaz de
reconocer las caras de sus familiares y amigos, y tampoco podía reconocer la forma de objetos familiares. Era incluso
incapaz de percibir la diferencia entre un cuadrado y un triángulo. Al mismo tiempo, no tenía problemas para reconocer a
las personas por la voz o los objetos mediante el tacto. Su proble- ma era exclusivamente visual.
El diagnóstico de agnosia perceptiva visual en el caso de DF está refor- zado por características adicionales. No es capaz de
dibujar un objeto que se le presenta visualmente pero puede hacerlo si se le pide que lo dibuje de memoria. Que no se trata
de un problema sensorial, lo demuestra el hecho de que DF puede discriminar colores, y puede detectar objetivos definidos
por cambios en luminancia que aparezcan incluso a una distancia de 30 grados en la periferia visual. Una característica
básica que DF ha perdido es la capacidad para detectar la orientación de los objetos. Ante una prueba de discrimina- ción
de enrejados no es capaz de diferenciar su orientación aunque sí es capaz de discriminar su frecuencia espacial; de hecho,
su función de sensibilidad al contraste es normal por encima de los 5 c/gav aunque es ligeramente inferior a la sensibilidad
normal para las bajas frecuencias. El problema con la orien- tación no parece tener su origen en la corteza visual primaria
porque todas las pruebas que se le han hecho mediante el uso de potenciales corticales mues- tran que el procesamiento en
esta área permanece intacto.
Las primeras pruebas neuroanatómicas que se hicieron a DF mostraron que el daño cerebral que padecía era bastante
difuso, característica bastante frecuente en casos de anoxia. No obstante, estudios posteriores que utilizaron resonancia
magnética mostraron que las zonas ventrolaterales de la corteza occipital estaban particularmente afectadas mientras que la
corteza visual pri- maria estaba bien preservada. Parece, por tanto, que el problema fundamen- tal de DF es de naturaleza
perceptiva y está preferentemente relacionado con la percepción de la forma. A pesar de que es capaz de procesar la
luminancia y el color, no es capaz de percibir formas cuyos contornos estén definidos por diferencias en luminancia o en
color. Lo mismo ocurre si los contornos están definidos por diferencias en la dirección del movimiento o en los planos de
profundidad. Los principios gestálticos fundamentales de proximidad o se- mejanza tampoco están operativos en el sistema
visual de DF.
Lo más notable en el comportamiento visual de DF es que, a pesar de su profunda deficiencia en la visión de la forma, es
capaz de utilizar la informa- ción basada en el tamaño, la forma y la orientación de los objetos para con- trolar una amplia
gama de movimientos guiados visualmente. DF es capaz de elevar la mano para estrechar la de la persona a la que es
presentada. Muestra una aptitud perfecta para alcanzar la manilla de la puerta que quiere abrir, aunque se trate de una
situación nueva. Puede andar fácilmente sin ayuda por una habitación o un patio sorteando los obstáculos que encuentra en
su cami- no. Más aún, puede alcanzar y agarrar con gran precisión un objeto situado delante de ella, a pesar de que poco
antes era incapaz de identificar ese objeto. En una prueba tipificada a la que fue sometida, DF se situó a una distancia des-
de la que una persona sin daño cerebral podía ver perfectamente una ranura grande, parecida a la de un buzón de correos,
cuya orientación podía variar. El examinador dio a DF una tarjeta grande y le pidió que, desde el lugar donde se
encontraba, girara la tarjeta hasta hacerla coincidir con la orientación de la ranura. DF no pudo llevar a cabo esta tarea. A
continuación, el examinador le pidió que insertara la tarjeta por la ranura y DF lo realizó sin problema alguno.
Otras muchas pruebas, parecidas a la que se acaba de exponer, han de- mostrado claramente que DF puede utilizar
información para controlar su comportamiento a pesar de que no es capaz de discriminar o identificar esa información
cuando se le pide que la describa.
En resumen, casos como el de DF y casos como los de ataxia óptica mues- tran entre sí las características propias de una
doble disociación. DF, cuyas lesiones se centran en la zona ventrolateral de la corteza occipital, muestra claros problemas
perceptivos mientras que su capacidad para utilizar la in- formación visual para controlar sus acciones permanece intacta.
En el caso contrario, las personas con ataxia óptica, y de forma general los pacientes con daño en la corteza parietal
posterior, no muestran problemas perceptivos cuando tienen que describir los objetos que se les presentan, pero tienen gra-
ves problemas para actuar sobre esos objetos guiados por la información que parecen percibir.
Sobre la base del estudio de casos clínicos como los que acabamos de ver, y de experimentos con animales que han
producido disociaciones similares, Milner y Goodale han propuesto la existencia de vías visuales especializadas que
ofrecen un serio apoyo a las propuestas de Neisser y de Norman.
3.3. La propuesta de Norman
A partir de los trabajos de Milner y Goodale, Norman ha dado un paso más proponiendo una diferenciación más explícita
de los dos sistemas de per- cepción visual y relacionando los dos sistemas con las teorías constructivista y ecológica.
- características de los dos sistemas
Norman ha enumerado una serie de características que permiten contrastar
las diferencias de los dos sistemas perceptivos. Son las siguientes:
a) Función. Aunque los dos sistemas analizan la estimulación visual, difie- ren en el objetivo de sus respectivos análisis.
Mientras el sistema ventral analiza la información para reconocer e identificar los estímulos, el sistema dorsal lo hace para
guiar visualmente el comportamiento del organismo.
b) Sensibilidad. Los dos sistemas muestran una sensibilidad diferente para las frecuencias espaciales y temporales. El
sistema ventral es más sensi- ble a las frecuencias espaciales altas, mientras que el sistema dorsal lo es a las frecuencias
temporales altas. Dicho de otra forma, el sistema ventral está más preparado para procesar los detalles de una escena
mientras que el dorsal es más sensible a los aspectos globales que pro- porcionan las frecuencias espaciales bajas. En
compensación, el siste- ma dorsal es mejor a la hora de percibir el movimiento.
e) Memoria. El sistema ventral mantiene una estrecha relación con el sis- tema de memoria con el fin de poder llevar a
cabo el reconocimiento y la identificación de los objetos y de los acontecimientos. El sistema dorsal no dispone de una
memoria a largo plazo, simplemente necesita una memoria de corta duración que permita la integración de la inf on line.
d) Velocidad. El sistema dorsal es más rápido. Este hecho es debido a que este sistema recibe preferentemente
proyecciones del sistema magno- celular, mientras que el sistema ventral recibe preferentemente proyec- ciones
parvocelulares que son de conducción más lenta.
e) Consciencia. El sistema ventral está más directamente reldo con la toma de consciencia de la inf que el sistema dorsal.
Como hemos visto, la paciente DF es capaz de utilizar para con trolar sus actos información visual q no es capaz de
percibir de forma consciente. Parece, por tanto, que el sistema dorsal puede funcionar con bastante precisión de forma
inconsciente, mientras q la identificación y la discriminación requieren un nivel de consciencia más alto.
f) Marco de referencia y métrica. Para reconocer e identificar objetos el sistema ventral necesita un marco de referencia
alocéntrico. El procesamiento de la inf que lleva a cabo este sistema necesita, por tanto, alcanzar una representación del
objeto centrada en el objeto mismo. Sin embargo, para alcanzar, agarrar y, en general, interactuar con los objetos,
necesitamos marcos de referencia centrados en el sujeto que nos permitan calcular, por ej, cuanto tenemos que alargar el
brazo, o cual debe ser la separación entre los dedos pulgar e índice si queremos alcanzar una taza, etc. Por eso, el sistema
visual dorsal necesita marcos de referencia egocéntricos. De forma parecida, el sistema dorsal necesita tener información
sobre la distancia absoluta a la que se encuentran los objetos, mientras que al sistema ventral le es suficiente con tener
información relativa de las posiciones de los objetos.
g) Input visual. Norman incluye otros dos aspectos que diferencian a los dos sistemas. Por una parte, el sistema ventral
está especializado en la visión central controlada por la fóvea, mientras que el sistema dorsal lo está para la visión
periférica. Estas características están ligadas a las proyecciones magno y parvo celulares mencionadas anteriormente. Por
otra parte, los dos sistemas también difieren en su grado de depen- dencia respecto a distintas claves a la hora de procesar
la profundidad. Mientras que el sistema dorsal sufre considerablemente cuando se ve obligado a trabajar exclusivamente
con claves monoculares, el sistema ventral no se ve tan disminuido por este hecho.
A pesar de las diferencias q acabamos de enumerar, debe tenerse en cuenta que ambos sistemas llevan a cabo operaciones
semejantes en el sentido de que ambos operan con formas, tamaños y distancias de los objetos. Lo importante es caer en la
cuenta de que la finalidad de los respectivos procesamientos es diferente, de ahí que la primera diferencia enumerada, la
que hace referencia a la función es la más determinante de todas. Obviamente en las personas en las que la visión funciona
normalmente, estos dos sistemas actúan de forma integrada e intercambian continuamente la información entre sí. S Son
las situaciones experimentales o clínicas, que nos permiten observar la r disociación de los dos sistemas, las que
proporcionan información acerca de S la especialización característica de cada uno de ellos.
- Relación entre los dos sistemas y las teorías perceptivas
Después de haber explicitado las caracs de los dos sistemas visuales, entenderemos mejor la propuesta de Joel Norman.
La propuesta fundamental que hace es que una teoría completa de la percepción visual necesita una aproximación dual que
incorpore las características diferenciales tanto del sistema ventral como del sistema dorsal. Para Norman, el problema de
las aproximaciones constructivista y ecológica es que han to- mado la parte por el todo. El constructivismo ha entendido la
percepción como un proceso de construcción progresiva de una representación encaminada a reconocer e identificar
objetos. Como acabamos de ver, estas parecen ser funciones especializadas del sistema ventral. Por otra parte, la postura
eco- lógica de Gibson ha entendido la percepción como un proceso de extracción directa de la información que
proporciona el medio con el fin de dirigir la actividad del organismo. También hemos visto que estas parecen ser las fun-
ciones especializadas del sistema dorsal. Otras características de los sistemas que hemos enumerado anteriormente también
encajan con los principales supuestos de cada una de las teorías. Por ejemplo, la teoría de Gibson trata de evitar a la hora de
explicar los fenómenos perceptivos, la implicación de la memoria y de otros procesos cognitivos, mientras que para los
constructivis- tas el papel de la memoria es esencial para subsanar la pobreza del estímulo. También en este punto ambas
posiciones pueden tener razón si tenemos en cuenta que el reconocimiento e identificación de objetos que lleva a cabo el
sistema ventral exige una activa participación de la memoria, mientras que el control on-line de la acción que caracteriza al
sistema dorsal no necesita la implicación de la memoria.
A la luz de la información proporcionada por casos neuropsicológicos como el de la paciente DF, merece la pena señalar la
verosimilitud que el concepto de propiedad funcional (affordance) propuesto por Gibson, adquiere como realidad
estimular. Como vimos en el Capítulo 1, según Gibson, las propiedades funcionales de los objetos del medio ambiente son
propiedades que el sistema visual extrae directamente de la estimulación para controlar su comportamiento. Para Gibson la
captación de esas propiedades funcionales no requiere la categorización previa de un objeto sino que es independiente de
ella. En el caso de DF hemos visto que su sistema dorsal intacto le permitía actuar adecuadamente respecto a objetos que
su sistema ventral dañado era incapaz de reconocer.
No podemos analizar en detalle todas las implicaciones de la propuesta de Norman. Sí creemos que su propuesta es muy
interesante y que merece una seria consideración. La propuesta de Norman no sólo da un posible marco de unificación de
teorías fuertes pero aparentemente irreconciliables, sino q sugiere interesantes hipótesis que pueden guiar la investigación
futura. Terminaremos este capítulo considerando en mayor detalle su aportación concreta a los problemas que hemos
tratado en este capítulo, las claves de profundidad y la constancia del tamaño.
las claves de la profunidad: Para Norman, tanto el sistema ventral como el dorsal son capaces de procesar la estructura
tridimensional del espacio. Sin embargo, mientras que el sistema ventral lo hace preferentemente a través de claves
monoculares de naturaleza pictórica, el sistema dorsal lo realiza a través de la captación de invariantes y la utilización de
claves binoculares tales como la estereoscopia. Norman ha propuesto que se reserve el término clave para clasificar a los
indicadores utilizados por el sistema ventral y que se utilice el término invariante para clasificar a los utilizados por el
sistema dorsal. Las principales diferencias entre claves e invariantes serían, según Norman, las siguientes:
a) Son procesadas por distintos centros cerebrales, las vías ventral y dor- sal como ya hemos explicado.
b) La extracción de información invariante está incorporada en la confi- guración física (hardwired) del sistema dorsal,
mientras que las claves son de carácter algorítmico y, por tanto, más susceptibles de cambio en el grado de inf que
proporcionan para el análisis del medio ambiente visual.
e) Los invariantes son extraídos directamente, sin recurso a procesos adicionales. Por el contrario, las claves sirven de base
a procesos de inferencia más o menos consciente.
d) Los invariantes son probablemente innatos mientras que las claves son probablemente aprendidas.
Norman apoya su propuesta en abundantes observaciones que sólo po- demos apuntar brevemente. Por un lado aduce
numerosas observaciones con pacientes neuropsicológicos con lesiones en la vía ventral, como por ejemplo el de la
paciente DF que hemos descrito anteriormente. Al parecer, para el control de las acciones que los pacientes con lesiones en
la vía ventral llevan a cabo sin problema alguno, es crucial la utilización de invariantes binoculares, tales como la
estereoscopia, y de invariantes de movimiento. Por otro lado, su propuesta también se apoya en experimentos realizados
con personas sin daño cerebral en los que se ha comprobado que existe una disociación entre las respuestas que los
observadores dan a una misma estimulación, depen- diendo del sistema utilizado para responder. Por ejemplo, Aglioti, De
Souza y Goodale demostraron que ante una estimulación ilusoria como la provocada por la llamada ilusión de
Ebbinghaus19, que puede observarse en la Fig 4.22, los observadores mostraban una clara
influencia de la ilusión cuando se les pedía que juzgaran el tamaño de los dos círculos
centrales. Sin embargo, si se les pedía que cogieran los círculos centrales, y se medía la
amplitud de la apertura de los dedos al cogerlos, se podía comprobar que la ilusión de
tamaño no producía efecto alguno. Mientras que la emisión del juicio de tamaño estaba
probablemente mediada por la inf consciente proporcionada por el sistema ventral, el control
de la acción de coger lo estaba por la información no consciente proporcionada por el
sistema dorsal. Era como si la ilusión pudiera engañar al ojo pero no a la mano.
la percepción del tamaño: El experimento que acabamos de mencionar ilustra también el hecho de que los factores que
determinan la percepción del tamaño pueden ser diferentes según intervenga en su percepción el sistema ventral o el dorsal.
Aunque no se conocen bien los factores que determinan una ilusión como la de Ebbinghaus, es probable que se deba a
procesos de inferencia que toman en consideración diferentes aspectos de la escena visual tal como postulan los
constructivistas. En la medida en que el sistema dorsal no se ve afectado por estos factores, la ilusión tampoco tiene efecto
sobre la acción de coger los círculos.
Norman ha puesto mayor énfasis en la importancia que tiene una concepción dual como la que él propone para explicar el
fenómeno de sobreconstancia que expusimos. Vimos que un factor importante en la producción de este fenómeno eran las
instrucciones objetivas dadas al observador, que ponen en juego mayor cantidad de procesos cognitivos de inferencia,
estimación y familiaridad. Cuanto mayor es la influencia de estos procesos, mayor es la implicación del sistema visual
ventral. Sin embargo, bajo instrucciones retinianas, más directamente reldas con lo percibido y con menos implicación
cognitiva, es probable que la estimación del tamaño dependa de la información más directamente proporcionada por los
invarian- tes. En este caso, la constancia es más precisa y no se produce un efecto de sobreconstancia.
Aún es pronto para poder valorar una propuesta como la de Norman. Sin embargo hemos visto que hay razones para
tomarla en consideración e inves- tigar su alcance. Como ya dijimos anteriormente no sería la primera vez que teorías
aparentemente opuestas cuando son propuestas como teorías genera- les de un determinado campo de investigación
perceptual, resultan compati- bles cuando se acierta a delimitar el campo de aplicación de cada teoría. En lo referente a la
percepción visual del espacio, la propuesta de Norman aparece como una corriente de aire fresco que puede ayudar a
integrar posiciones vividas durante décadas como irreconciliables.
T.5 PERCEPCIÓN DEL MOVIMIENTO
Tb podemos percibir movimiento en dets condiciones aunq no haya desplazamiento físico de los objetos ni del observador.
La percepción del movimiento es particularmente importante para el desenvolvimiento y supervivencia de los organismos
en el entorno. Coren, Ward y Enns señalan otras funciones importantes de la percepción del movimiento reldas con:
1) la posibilidad de seguir la trayectoria de los objetos mediante movimientos oculares apropiados.
2) la formación de objetos mediante la separación de la figura y el fondo, por ejemplo, agrupando las partes que se mueven
en una misma dirección y segregando el objeto del fondo inmóvil mediante el principio de destino común que ya se verá.
3) la extracción de la forma del objeto y su estructura tridimensional a partir del patrón de movimiento de la imagen.
obteniendo diversas perspectivas del objeto proporcionadas por el mov del objeto o el mov del observador.
4) la identificación del objeto a partir del movimiento como, por ej, la identificación de un ave a partir del mov de sus alas.
Quizás por esta importante razón de adaptación, el sistema visual es extraordinariamente sensible a la percepción del
movimiento; y la invest sobre percepción del mov ha sido una de las áreas que más desarrollo ha alcanzado en el campo de
la percepción visual en los últimos años y en la q se ha producido una mayor integración desde las diversas perspectivas.
1. MOVIMIENTO REAL
movimiento real: cuando se percibe mov como consecuencia del desplazamiento de un objeto o un punto en el espacio.
Existen muchos desplazamientos de los objetos q no podemos percibir porque están por debajo de nuestro umbral de
detección del mov. Ej: el movimiento de la luna, son tan lentos que no los podemos percibir; sólo podemos inferir q dichos
objetos se han movido cuando después de transcurrido un tiempo observamos q han cambiado de posición en el espacio.
1.1. Umbrales de detección del movimiento
La invest clásica se centró en determinar los umbrales de detección del mov utilizando como Es puntos q se desplazaban
vertical u horizontalmente en el campo visual. Umbral de detección del movimiento: la magnitud mínima de distancia
(para el umbral de desplazamiento) o de velocidad (para el umbral de velocidad) que puede detectar un observador cuando
examina un objeto en mov continuo. Las invests en este campo se deben a Aubert, quien usó como Es en sus experimentos,
puntos o líneas luminosos q se desplazaban horizontalmente a una velocidad constante sobre un fondo q consistía en un
dispositivo que giraba. Los resultados mostraron q el umbral de detección del mov variaba, según se tratara de:
- un movimiento absoluto (desplazamiento de un punto luminoso sobre un fondo uniforme)
- o de un mov relativo (desplazamiento sobre un fondo que proporcionaba puntos de referencia estacionarios: ej, líneas
inmóviles perpendiculares o paralelas a la trayectoria del punto luminoo (fig 5.1)).
El umbral era aprox de 0.03º de ángulo visual por segundo (q equivale a unos 0.25 mm por segundo) cuando los
observadores dijaban su vista sobre el objeto q se movía (un punto luminoso situado a una distancia de 50cm) y se
proporcionaba además un marco de ref, un fondo con textura en el q se podían percibir líneas inmóviles. Bajo estas
condiciones, el mov mínimo que se puede detectar es de 0.25mm por segundo. Cuando se eliminaba el marco de referencia
y el punto se desplazaba sobre un fondo oscuro, el umbral aumentaba. El efecto del marco de referencia (fondo de líneas)
indicaría que el sistema visual es más sensible al mov relativo, que al movimiento absoluto. Este efecto del marco de ref
(fondo de líneas) indicaría q el sistema visual es más sensible al mov relativo q al absoluto. Este efecto no se produce
cuando la exposición de los estímulos es muy corta (menos de 4 seg) y se produce cuando los estímulos se exponen al
menos durante 12’’. Éstos serían los umbrales de movimiento para una sit en la q el observador fija su vista en el objeto
que se mueve. En ambos casos el mov se capta en la fóvea, donde la sensibilidad al mismo es máxima.
Tb se puede percibir el movimiento cuando el observador fija la vista en un punto
inmóvil y no en el objeto q se mueve. En este caso el mov se capta en zonas de la
retina distintas a la fóvea, en la parafóvea o la periferia visual, en las que la
sensibilidad al mov decrece. El umbral de detección del mov aumenta, y en
consecuencia la sensibilidad decrece, a medida q la imagen en mov se desplaza desde la fóvea hacia la periferia visual,
siendo el umbral de detección mayor en la periferia que en la fóvea. Por tanto la zona retiniana en la que se capta el mov es
otro fr importante en al determinación del umbral de detección. Cuando el mov se capta en la periferia visual se pueden
observar fenómenos paradójicos, q parecen ir en contra de lo esperado. Uno de estos: la “paradoja de Aubert-Fleisch”:
consiste en la impresión de que un objeto se mueve más lentamente cuando se fija la vista en él y se capta en la fóvea, que
cuando se fija la vista en un objeto inmóvil y el objeto en mov se percibe en la periferia visual. Si la sensibilidad al mov es
máxima en la fóvea y decrece a medida q el mov se capta en la parafóvea y la periferia, sería de esperar el resultado
contrario, es decir la percepción de q un objeto se mueve más rápido cuando se fija la vista en él. Lo q se produce en este
caso es una infravaloración de la velocidad.
Demostraciones de efectos paradójicos
Resalte de la percepción del movimiento en la periferia visual
Los efectos paradójicos se producen pq aunq la sensibilidad al mov es mayor en la fóvea. sin embargo el mov captado en la periferia
visual «resalta» más q el que se capta en la fóvea. Para comprobar esta afirmación observe los dedos de la mano justo por delante del
libro; a continuación, estire el brazo hacia la derecha e intente mirar de lado los dedos. Observará que casi no puede percibirlos
mientras permanecen quietos. Sin embargo, si los mueve no tendrá ninguna dificultad en percibir el movimiento.
Paradoja de Aubert-Fieischl
Una demostración aproximada sobre este fenómeno sería la siguiente. Sitúese frente a una pared, y extienda un brazo. A continuación,
cierre los ojos y mueva varias veces el brazo hacia la derecha y la izquierda a una velocidad moderada. Tras unos minutos. abra los ojos
y mire a la pared. Intente determinar la velocidad a la que se mueve la mano y la trayectoria que sigue el brazo {la distancia que
recorre). A continuación, coja un bolígrafo y realice los mismos movimientos que antes pero fíjese exclusivamente en el bolígrafo e
intente seguirlo con la vista (visión en la fóvea). Advertirá que el movimiento de la mano parece que se mueve de forma más lenta
ahora y que la trayectoria es más corta que cuando se miraba a la pared (visión periférica).
2. ILUSIONES DE MOVIMIENTO distintos tipos de mov percibido en ausencia de desplazamiento físico del objeto.
Posefectos de movimiento: se producen tras la observación prolongada de un mov continuo y constante, en los q la
dirección del mov percibido inicialmente cambia y se percibe en sentido contrario, y su velocidad decae gradual. Ejs:
-Ilusión de la cascada: si se observa una cascada fijando la vista en un punto que sobresalgan del agua, durante un 1’ o más
y dp se dirige la mirada hacia el paisaje q la rodea o cualquier objeto inmóvil, se percibe un mov en dirección hacia arriba,
es decir, en dirección contraria a la dirección del mov del agua de la cascada al caer.
- Posefecto de la espiral o ilusión de la espiral de Plateau: si se fija la vista durante un 1’ o más, en una espiral dando
vueltas (ej sobre una peonza) y dp se fija en un objeto inmóvil, el mov percibido inicialmente se percibirá en sentido
contrario. Esta experiencia se puede realizar dibujando una espiral sobre una cartulina y colocándola sobre un tocadiscos.
Dp de observarla 1’ o más se fija la vista sobre un objeto inmóvil y se puede percibir el mov en dirección contraria.
-Movimiento paradójico: se llama así pq se percibe el posefecto de mov, pero no se percibe un cambio en la posición
percibida de los objetos que se mueven. Se puede producir observando la lista de créditos de una película mientras se fija la
vista en un objeto sin mov del fondo de la pantalla del tv. Si después de esta observación, se cambia la mirada a un objeto
inmóvil se percibe el mov hacia abajo; es decir, en dirección contraria al mov de la lista de créditos.
La explicación más aceptada sobre los posefectos de mov es q están causados por la adaptación de los detectores de mov
sintonizados a la dirección del mov que se está observando. Si se está observando un mov en dirección hacia abajo como el
del agua en una cascada, durante un tiempo det, los detectores específicos de esa dirección (hacia abajo) se llegan a adaptar
como consecuencia de la exposición a una estimulación continua y continuada y la sensibilidad decrece. Por eso, cuando
dp se fija la vista en otro objeto, se pueden activar los detectores específicos de otras direcciones de mov, dando la
impresión de q se produce un mov en dirección contraria.
La evidencia procede de estudios q indican que las células del área V1 que responden a una dirección específica del mov tb
se adaptan mejor a esa dirección que a otras; o q los posefectos no se producen cuando se provoca rivalidad binocular
presentando a cada ojo movs en direcciones distintas. Según esto, las áreas del cortex implicadas en la percepción del mov
serían las responsables de los posefectos de mov.
Movimiento auto-cinético: ilusión de mov q se produce en ausencia total de desplazamiento del objeto. Consiste en la
percepción del desplazamiento lento y continuo de un punto luminoso estacionario, cuando se observa en total oscuridad
durante un período de tiempo prolongado (más de 2’). El mov cambia de dirección aprox 10’’. La ilusión no se produce
cuando se observa bajo condiciones que permiten observar que el punto luminoso es inmóvil, por ej cuando se ilumina
parte de la sala donde se observa el punto. El efecto disminuye cuando se coloca algún objeto cercano al punto de luz,
posiblemente porque da un marco de ref que permite percibir que el punto luminoso permanece inmóvil.
En condiciones naturales se puede observar la ilusión si se fija la vista en una única estrella sobre un cielo homogéneo. El
mov auto-cinético se percibe con mayor claridad cuando el foco de la luz es de baja intensidad, se observa con un sólo ojo
o existe fatiga o somnolencia. Se observa si se sitúa en una habitación oscura y coloca una luz muy tenue, ej, una linterna,
a una distancia de unos 2m. Dp de un periodo temporal, observará q la luz se desplaza en una dirección det.
Movimiento inducido: ilusión de mov en un objeto inmóvil consecuencia d la presencia simultánea de otro objeto en mov,
q generalmente es de mayor tamaño y circunda al primero. Ejs: la percepción de desplazamiento en la luna a través de las
nubes cuando hay viento, cuando lo que realmente se mueve son las nubes, ya que el sistema visual humano no es capaz de
detectar el mov de la luna por ser demasiado lento. Otros ejs serían la sensación de q nuestro tren se mueve cuando en
realidad se está moviendo el tren de al lado, o la impresión de que un edificio alto se tambalea cuando se observa desde
abajo en un día de viento en el que las nubes se desplazan con rapidez.
Para que se perciba mov inducido es necesaria la presencia de al menos dos objetos en el campo visual y uno de ellos tiene
que estar en mov. El desplazamiento del objeto en mov en relación con el objeto q permanece estacionario es el origen del
movimiento inducido. La ilusión se percibe más fácilmente cuando los objetos se presentan sobre un fondo homogéneo.
El movimiento inducido fue descubierto por Duncker. Presentó como E un punto luminoso rodeado por un rectángulo tb
luminoso sobre un fondo homogéneo, una habitación oscura. Observó q si el rectángulo se desplazaba en una dirección det,
por ej hacia la izquierda, se percibía el punto desplazándose en la dirección contraria (hacia la derecha) y viceversa.
Es posible inducir movimiento utilizando diversos proceds:
a) El ej más simple de mov inducido se produce cuando se presentan en el campo visual sólo
dos puntos, uno en reposo y el otro en mov. En esta sit se puede percibir desplazamiento en un
único punto o en los dos. Según Duncker, se percibe mov en los dos puntos únicamente cuando
el mov real del punto que se desplaza está por encima del umbral (no es demasiado lento); en el
caso contrario, es decir cuando el mov real no se detecta, sólo se percibe el mov inducido.
b) Cuando se presentan simultáneamente dos objetos en el campo visual, uno de mayor tamaño y rodea al otro, con
independencia de cual de los dos objetos se desplace y siempre q el mov real esté cercano o por debajo del umbral de
detección, se percibirá únicamente el movimiento del objeto situado en el centro hacia el exterior. Si el movimiento está
por encima del umbral y el objeto en movimiento es el circundante, se percibirá el movimiento de los dos objetos. El
objeto circundante y de mayor tamaño actúa como marco de referencia para el otro objeto. Explicaciones:
Duncker, podría deberse a consecuencia del desplazamiento relativo de los objetos en el campo visual. Si uno de los
objetos rodea al otro, tiene mayor tamaño, etc., actuaría como el fondo sobre el cuál se percibe el mov. Si este objeto se
mueve, inducirá q el objeto estacionario se perciba en mov debido a q se produce un cambio relativo en las posiciones de
los dos objetos.
Wallach: podría deberse a q el sistema visual es más sensible al mov relativo entre dos objetos q al mov de un único objeto.
Rock: cuando el mov relativo entre dos objetos está por encima del umbral, (cuando se puede detectar la mayoría de las
veces), y el mov absoluto de cada objeto está por debajo del umbral (cuando el mov de cada uno de los objetos es
demasiado lento para que detectarlo), el sistema visual asume que el objeto más grande y que rodea al más pequeño es un
objeto inmóvil, y asigna el mov al objeto más pequeño y que está rodeado por el otro. Esta afirmación se apoya en que el
mov inducido desaparece o no se produce bajo las siguientes condiciones:
a) cuando el mov del objeto circundante está por encima del umbral, en este caso se percibe el mov de ambos objetos y
b) cuando se introduce alguna condición q permite observar el mov del objeto circundante (se ilumina la habitación), en
este caso no se observa mov inducido en el objeto más pequeño, sino sólo el desplazamiento del objeto circundante.
Movimiento aparente: En 1912, Wertheimer publicó un artículo sobre el movimiento aparente o estroboscópico que los
historiadores consideran como el inicio de la P de la Gestalt. En su experimento, que tuvo como sujetos experimentales a
Kohler y Koffka, Wertheimer presentaba como estímulos dos líneas paralelas verticales separadas por una distancia de un
centímetro. Se observaron distintos fenómenos que dependían fundamen- talmente del intervalo temporal entre la
presentación de las líneas (Fig 5.3). Cuando el intervalo era largo (200 milisegundos o más) se percibía una sucesión de
líneas sin ningún tipo de movimiento (primero una y después la otra).
Si el intervalo temporal era muy corto (menos de 30 milisegundos), las
dos líneas se percibían simultáneamente. En ninguno de los dos casos
se percibía movimiento. Cuando el intervalo temporal de presentaoon
entre las dos líneas era intermedio, entre 30 y 60 milisegundos, se
observaba un movimiento parcial, la primera línea parecía trasladarse
hasta aprox la mitad de la distancia que la separaba de la otra línea, y
la segunda línea parecía recorrer el resto de la trayectoria. Finalmente,
alrededor de los 60 milisegundos, se percibía movimiento, como si
realmente cada línea se desplazara hacia la posición que ocupaba la
otra. A este fenómeno de percep- ción del movimiento en ausencia de
un desplazamiento físico del objeto, se le denominó movimiento
aparente o movimiento óptimo. También se descubrió en estos
experimentos el movimiento <<FÍ>> o <movimiento puro>>, que
aparecía en el intervalo temporal entre 60 y 200 milisegundos y que
tenía como consecuencia la percepción de movimiento sin que se viera
el objeto que se movía, de aquí el nombre de movimiento puro.
- condiciones que determinan la percepción del movimiento aparente
El descubrimiento del movimiento aparente no sólo tuvo importancia en el de- sarrollo de la Teoría de la Gestalt, sino que
tuvo una enorme repercusión en la Psicología Experimental y numerosos investigadores se dedicaron a analizar el
fenómeno. Ej: Korte analizó detalladamente las condiciones que permiten la aparición del movimiento aparente, variando
la intensidad de los estímulos (1), la distancia entre estímulos (DEE) y el intervalo temporal entre los mismos (lEE). Sus
resultados pusieron de manifiesto las siguientes relaciones entre estas tres condiciones que producen movimiento aparente
y se conocen como las “leyes de Korte”, aunque algunos autores no las consideran como verdaderas leyes.
- Si se mantiene constante el intervalo temporal entre estímulos (lEE), la distancia óptima
para obtener mov aparente varía directamente con la intensidad de los estímulos, una mayor
distancia requeriría una intensidad mayor y viceversa.
- S i se mantiene constante la distancia entre estímulos (DEE), el valor óptimo del intervalo
temporal entre estímulos (lEE) para que se produzca mov aparente varía inversamente con
la intensidad de los Es, un mayor lEE requeriría una intensidad menor y viceversa.
- Si se mantiene constante la intensidad de los estímulos (1), el valor óptimo de la distancia
entre estímulos (DEE) varía directamente con el intervalo entre estímulos (lEE), una mayor
distancia requeriría un lEE mayor y viCeversa.
Pero ¿qué ocurre cuando se presentan más de dos estímulos y se aplica la alternancia de
encendido que daba lugar a la percepción de mov aparente? Figura 5.4. A ejemplifica una
disposición estimular más compleja en la que simultáneamente se presentan varias luces que
se encenderían en dos tiempos diferentes T1 y T2 con una tasa de alternancia adecuada para
que se observara mov aparente. Cuando se presenta esta sit se percibe el mov indicado en B,
es decir un movimiento en línea recta de izquierda a derecha. Sin embargo, ésta no es la
única trayectoria posible. En C, se presentan las posibles trayectorias de movimiento, que
además podrían aumentar a medida que aumenta el número de estímulos. ¿Por qué se
percibe la trayectoria descrita en B y no las representadas en C o cualquier combinación de éstas?. Esta situación
representa el problema de la correspondencia, en movimiento aparente, y parece que se debe a la adopción por parte del
sistema visual de determinadas reglas fijas como la proximidad espacial y temporal entre estímulos. Es decir, se percibe
mov entre los Es q presentan distancias más cortas o entre trayectorias q requieren menos tiempo.
Aunque la experimentación sobre movimiento aparente se ha realizado utilizando Es muy simples. Ej: los anuncios
luminosos que presentan figuras en mov, las imágenes del cine, tv o pantalla del ordenador son fenómenos de movimiento
aparente. En todas estas situaciones percibimos movimiento, pero lo que en realidad se está presentando como estímulo es
una escena inmóvil que es sustituida por otra después de un período de tiempo det. La tasa de cambio de la escena es de
aprox 24 veces por segundo en el cine, treinta veces por segundo en la tv y sesenta en la pantalla del ordenador.
- tipos de movimiento aparente
Braddick diferencia dos tipos de movimiento aparente:
1) Movimiento de corto alcance: se percibe cuando se observan películas en el cine, vídeos o en la pantalla del ordenador.
Se caracteriza por desplazamientos cortos (menos de .25° de ángulo visual) y tasas de alternancia rápidas (de 20 a 80
milisegundos). Se percibe monocularmente (con un sólo ojo) y con anterioridad a la integración de la inf procedente de los
dos ojos y al análisis de la forma y el color. En el laboratorio, este tipo de mov se estudia mediante la técnica
cinematograma de puntos aleatorios: consiste en colocar puntos al azar en cada una de las escenas q componen una
determinada secuencia, y analizar - a través de la manipulación de distintas variables (ej: el desplazamiento vertical u
horizontal de los puntos en escenas sucesivas)- qué intervalos espacio-temporales dan lugar a la percepción del mov.
2) Movimiento de largo alcance. Es el mov que se percibe en los experimentos descritos en la Teoría de la Gestalt y en los
anuncios luminosos. Se puede observar cuando las distancias son largas (más de 20° de ángulo visual) y el período
temporal de alternancia entre estímulos mayor de 200 milisegundos. Se da en etapas de procesamiento más tardías, es
binocular y requiere la integración de la inf de los dos ojos, la formación de unidades perceptivas por medio de la
organización perceptiva así como un análisis de la forma y el color.
La propuesta teórica de Braddick ha sido puesta en cuestión posterior- mente mediante sugerencias que indican que el
análisis del movimiento podría ser más complejo. En primer lugar, algunos autores señalan que, dado que los estímulos
utilizados en los experimentos sobre movimiento de corto y largo alcance son tan diferentes, es posible que lo que reflejen
las diferen- cias entre los dos tipos de movimiento sean respuestas diferentes de un único proceso a la estimulación
diferente, en lugar de la actuación de dos procesos distintos. Por otra parte, los resultados de estudios psicofísicos
posteriores in- dican que el sistema visual podría realizar tres tipos diferentes de análisis del mov. Los dos primeros, que
realizarían un procesamiento de abajo-arriba se corresponderían con el movimiento de corto alcance. En los dos sistemas,
el sistema de primer orden, cuya informa- ción básica es la luminancia y el sistema de segundo orden, cuya información
básica es la textura, se detectaría el movimiento a través de circuitos simples de detección del movimiento. Los sistemas de
análisis del movimiento de primer y segundo orden se caracterizan además por ser monoculares, sensi- bles y rápidos. El
tercer tipo de sistema de análisis del movimiento, que se correspondería con el movimiento de largo alcance propuesto por
Braddick, se caracteriza por ser binocular, poco sensible y lento, pero es más versátil que los sistemas de primer y segundo
orden y puede analizar cualquier tipo de estimulación. De acuerdo con Lu y Sperling, este sistema utilizaría tanto procesos
de abajo-arriba como de arriba-abajo en los que intervendría la aten- ción, que puede determinar el que se perciba o no
movimiento así como la dirección del mismo.
3. MECANISMOS FISIOLÓGICOS
3.1 Detectores del movimiento
Todavía no se conocen con exactitud los mecanismos fisiológicos que subya- cen a la percepción del movimiento; sin
embargo, dado el notable desarrollo que han alcanzado estos estudios examinaremos algunas de las aportaciones realizadas
hasta el momento. Una de las primeras preguntas, en relación con los mecanismos neuronales que subyacen a la percepción
del movimiento, es si existen neuronas especializadas en la detección de la dirección del mov. A partir de los años 60,
utilizando la técnica de registros unicelulares, se identificaron neuronas sensibles al movimiento en una determinada
dirección en los sistemas nerviosos de distintos organismos: ranas, palomas, conejos, ardillas, gatos y monos. Además, la
ubicación de las neuronas sensibles al mov es diferente según la escala filogenética. En organismos más inferiores en la
escala (ej: los conejos), aparecen en las células ganglionares de la retina, indicando que el procesamiento del movimiento
sería fundamentalmente periférico, mientras que en organismos más evolucionados como los gatos, únicamente un 1% de
las células ganglionares son sensibles al mov y no se han encontrado neuronas ganglionares sensibles al movimiento en los
monos, lo que indicaría q en los organismos superiores en la escala filogenética, el mov se procesa a un nivel más central.
La evidencia sobre la existencia de detectores de la dirección específica del mov en humanos procede de estudios
psicofísicos sobre posefectos de mov. El posefecto de mov de la cascada sugiere q, como consecuencia de una exposición
continuada a una estimulación, dets neuronas llegan a fatigarse y la fatiga puede sesgar el sistema hacia el mov contrario.
El posefecto de la cascada se estudió experimentalmente mediante una técnica denominada “adaptación selectiva”.
Mediante esta técnica se expone a los sujetos durante un período de tiempo prolongado a un E en mov; por ej, un patrón de
líneas que se desplaza en una det dirección. La exposición prolongada al E produce una disminución en la sensibilidad a la
dirección del movimiento observado bajo estas condiciones. Pero el declive en la sensibilidad no se generaliza a otras
direcciones o velocidades distintas de las observadas bajo condiciones de exposición prolongada. Los datos obtenidos con
la aplicación de esta técnica apoyan la existencia de neuronas sensibles al movimiento y sintonizadas a una dirección y/o
velocidad específica.
Los estudios realizados para determinar la ubicación de los detectores de la dirección del movimiento en humanos indican
que éstos no son periféricos y que se encuentran en el córtex visual. Mitchell et al presentaron un estímulo adaptador (mov
en una det dirección) a los observadores en un sólo ojo y obtuvieron posefecto de movimiento a una dirección específica.
El supuesto básico del que partían era que si los detectores de la dirección del mov estaban ubicados en la retina no debería
producirse transferencia del posefecto de movimiento al ojo que no había sido estimulado; es decir, el posefecto de
movimiento debía aparecer exclusivamente en el ojo en el que se había producido fatiga mediante la presentación
prolongada del estímulo adaptador. Sin embargo, los resultados mostraron que se producía el posefecto en los dos ojos.
Este resultado indicaría una transferencia del posefecto de mov de un ojo al otro, que únicamente se explicaría si los
detectores estuvieran situados en el córtex visual, en donde se combina la inf sensorial de los dos ojos. A su vez, esta
interpretación se ve reforzada por el hecho de q para q se produzca transferencia de los posefectos de mov binocular entre
los ojos es necesaria una buena visión binocular, ya q la transferencia no se produce en observadores con visión binocular
deficiente posiblemente debido a la falta de detectores de este tipo; y también por la necesidad de que exista fusión
binocular para q se produzcan posefectos de mov ya q cuando cada ojo observa mov en direcciones distintas no se produce
el posefecto de mov.
3.2 Análisis cortical del movimiento
Otros investigadores han examinado si se produce un análisis cortical del movimiento. En relación con este problema se
conoce que la mayoría de las células del área V1 son sensibles al mov de barras y bordes. Esto se ha determinado
examinando si son sensibles a una dirección específica. Si es así, su tasa de disparo será mayor ante esa dirección
específica q ante otras direcciones. Además, el grado de especificidad de las neuronas suele ser grande y algunas de ellas
responden de forma selectiva no sólo a una det dirección del mov sino tb a una det velocidad.
Sin embargo, en el área V1 parece que únicamente se responde a un desplazamiento de la imagen en la retina; el
procesamiento de aspectos más complejos del movimiento se realiza en zonas más especializadas, fundamen- talmente las
áreas MT y MST del lóbulo temporal que sepueden observar en la Figura 4.20. La evidencia sobre el papel desempeñado
por estas dos áreas en la percepción del movimiento procede de dos campos: los estudios sobre el efecto de lesiones
experimentales producidas en los primates y algunos estudios clínicos en humanos. En los estudios realizados con primates
se produce una lesión experi- mental inyectando sustancias que destruyen determinados centros nerviosos y se analiza el
efecto en la ejecución en tareas de detección del movimiento y otras funciones perceptivas (forma, color contraste, etc.).
Los resultados de estos estudios muestran que la ejecución en una tarea de detección de la dirección del movimiento se
deteriora sensiblemente cuando se produce una lesión en una pequeña parte del área MT como consecuencia de la
inyección de una toxina. Sin embargo, si el estímulo se presentaba en una parte distinta a la lesionada, la ejecución era
normal. Por otra parte, la lesión no afectaba a la ejecución en tareas distintas a la detección del movimiento como podía ser
la percepción del color. La importancia de estas áreas en la percepción del movimiento se ha puesto de manifiesto también
en estudios clínicos procedentes de la Neuropsicología, que indican cómo las lesiones en esta parte del cerebro dejan
intactas la percepción de la forma o el color pero dificultan o impiden totalmente la percepción del mov. En lugar de
percibir movimiento, estos pacientes perciben instantáneas en las que los objetos cambian bruscamente de posición,
perciben que el objeto cambia de posición pero no el desplazamiento de una posición a otra distinta.
4. MODELOS DE DETECCIÓN DEL MOVIMIENTO
Aunque se conoce que algunas células del cortex visual responden de manera selectiva a la dirección del movimiento, el
mecanismo por el que se responde de esa forma es desconocido. Para analizar este problema se han desarrollado modelos
de detección del movimiento; a continuación y a modo de ejemplo examinaremos dos de ellos.
Algunos modelos proponen básicamente un tipo de detectores que comparan la percepción de un estímulo (por ej un borde)
visto en una posición det (A) y en un tiempo (t1), con ese mismo E en una posición distinta (B) y en otro tiempo (t2). La
única diferencia entre estos modelos radica en la forma en que se establece la comparación.
Reichardt desarrolló el primer modelo sobre la disposición y fun- cionamiento de las neuronas sensibles a la dirección y
velocidad del mov en insectos. Un esquema del modelo se presenta en la Figura 5.5.
El modelo propone la intervención de varias unidades neuronales: a) las neuronas
representadas por A y B son receptores visuales contiguos, que se comportarían como
células corticales simples, células que responden a líneas o bordes que presentan una
determinada orientación y posición; b) las neu- ronas representadas en C realizan la función
de comparar las señales que provienen de A y de B.
El supuesto básico del modelo es el siguiente: cuando un estímulo (por ejemplo, una luz o
un borde) se desplaza a lo largo de una serie de receptores contiguos, por ejemplo de
izquierda a derecha, éste se detectará en el primer receptor visual (en este caso A) de la
misma forma que en el segundo (B) pero con una demora temporal (dt) que está
determinada por la distancia entre los receptores A y B, y por la velocidad de
desplazamiento del objeto. En la uni- dad C, se comparan las señales neuronales que
provienen de A y de B. Si las dos señales llegan al mismo tiempo, la unidad de
comparación e responderá, señalando movimiento del estímulo. Cada sistema (A y B) está
sintonizado a una dirección específica del movimiento. El sistema representado en la Figu-
ra 5.5, señalará la presencia de movimiento hacia la derecha (de A hacia B) porque el movimiento en dirección contraria
(de B hacia A) producirá señales que no llegan al mismo tiempo, es decir, señales que no están sincronizadas. Además de
la sintonización a una determinada dirección, las unidades neuro- nales A y B están sintonizadas a una determinada
velocidad que puede influir en la sincronización. Es decir, la velocidad puede determinar que las señalesprocedentes de A y
B lleguen o no al mismo tiempo. Dado que la coincidencia temporal entre ambas señales depende de la cantidad de demora
temporal de la señal de la célula A, cuando el estímulo presenta mayor velocidad, se nece- sitarán demoras temporales más
cortas para sincronizar las señales.
Adelson y Movshon propusieron un modelo en dos etapas para
explicar el mov en patrones complejos formados por enrejados, como
los que se han visto en el apartado dedicado al análisis de la frecuencia
espacial en el cap 3, que se desplazan en direcciones distintas (Fig
5.6). Según esta propuesta teórica, las unidades de la primera etapa
computarían la dirección del movimiento de cada enrejado
componente, es decir computarían movimiento local. Las unidades que
actúan en la segunda etapa combinarían la información de los
enrejados componentes para extraer la dirección del patrón compuesto;
es decir, computarían movimiento global. La evidencia a favor de este
modelo procede de un estudio realizado por De- rrington y Suero
(1991). Por otra parte, los estudios realizados por Movshon et al.
(1986) muestran que, cuando se presenta este tipo de estímulos, deter-
minadas células del área V1 responden a la dirección de los
componentes, al movimiento local, pero no responden a la dirección
del patrón compuesto, al movimiento global; mientras que las células del área MT responden a ambos tipos de movimiento
global y local. Los resultados parecen indicar que el pro- cesamiento en la primera etapa se desarrollaría en el área V1
mientras que, en la segunda etapa, el procesamiento se llevaría a cabo en el área MT.
5. PERCEPCIÓN DE ACONTECIMIENTOS
Los estudios sobre percepción de acontecimientos o sucesos analizan los cam- bios percibidos en la estructura del estímulo
a través del tiempo Qohansson, 1978). Los estímulos en este contexto son mucho más complejos que los ana- lizados hasta
ahora y consisten en secuencias de movimiento.
5.1. Percepción de la causalidad
La investigación pionera en este campo fue realizada por Michotte (1946) en sus trabajos sobre percepción de la causalidad
y se centró en el examen de las condiciones que determinan que un acontecimiento se perciba como causa de otro
acontecimiento. Un ejemplo ilustrativo es el que se puede observar en el movimiento de las bolas de billar; cuando una
bola golpea a otra y la segunda se mueve, se percibe que el movimiento de la primera bola es la causa del desplazamiento
de la segunda. Lo mismo ocurre con la percepción de aconte- cimientos, si un objeto en movimiento colisiona con un
objeto inmóvil y éste comienza a moverse en la misma dirección del primero, se percibirá que el movimiento del primer
objeto es causa del movimiento del segundo.
El planteamiento básico de Michotte parte de la consideración de que se puede percibir directamente la conexión causal
entre determinados tipos de acontecimientos sin necesidad de recurrir a la intervención de experiencias previas. Para que
esto se produzca es necesario que se cumplan las siguientes condiciones: 1) la presencia de dos objetos, A y B; 2) que el
movimiento de uno de los objetos se perciba en primer lugar; 3) que el impacto del objeto A sobre el objeto B se perciba en
la fóvea, para lo cual es conveniente que el observador fije su vista en el objeto B; 4) que no existan discontinuidades
pronunciadas entre tiempo, espacio y dirección del movimiento. En gene- ral, las condiciones límite para percibir la
causalidad serían las siguientes: a) cuando el tiempo transcurrido entre el impacto de A sobre B y el comienzo del
movimiento deBes menor que 100 milisegundos; b) cuando A no alcanza completamente a B sino que quedan separados
por una distancia mínima y e) cuando la dirección del movimiento deBes algo diferente de la del movi- miento de A. Sin
embargo cuando estas discontinuidades se acentúan no se percibe la causalidad.
Michotte, utilizando como estímulos unos cuadraditos que se observaban a través de una ranura en una pantalla, identificó
una serie de condiciones que permiten la percepción de distintos tipos de causalidad dependiendo de la dirección del
movimiento, su velocidad y el tiempo transcurrido desde la colisión de los dos objetos y el comienzo del movimiento del
segundo. Los tres tipos de efecto identificados por Michotte se pueden observar en la Figura 5.7.
En 1, se muestra el efecto de lanzamiento: A y B se presentan inmóviles,
movimiento de A hacia B, colisión de A y B, parada de A y mov de B. Para
q se perciba este efecto se requieren estas condiciones: la dirección del
movimiento de B debe ser aprox igual a la de A y la velocidad de
desplazamiento de B, debe ser menor o aprox igual a la de A.
En 2 se presenta el efecto de arrastre cuya secuencia es: desplazamiento de
A hacia B, colisión de A y B y desplazamiento de A y B unidos. Las
condiciones necesarias para que se pueda percibir el efecto de arrastre son
que se perciba previamente el movimiento de A y la percepción del
movimiento conjunto de A y B.
En 3, se presenta el efecto de disparo, que se produce cuando la velocidad
de desplazamiento de B, dp de la colisión, es superior a la q presenta A, y la
“impresión”, en términos de Michotte, es que el objeto B sale disparado como resultado de su colisión con A.
A pesar de la afirmación de Michotte de que la percepción de eventos era directa y posiblemente innata, los resultados de
estudios posteriores, en los que se utilizaron los mismos estímulos y condiciones experimentales, revelaron la existencia de
diferencias individuales en la percepción de los efectos de lanzamiento, arrastre y disparo, lo que sugiere que la percepción
de la causalidad podría estar influida por experiencias anteriores de los observadores (Boyle).
5.2. Movimiento biológico
La línea de invest sobre percepción del mov biológico, o mov de los organismos, desarrollada x Johansson quien diseñó un
proced para estudiar el mov del cuerpo humano: consistió en vestir a unos actores completamente de negro y colocar unos
discos luminosos en sus articulaciones (hombros, codos, muñecas, caderas, ingles, rodillas y tobillos); véase la Fig 5.8. El
actor o actores, permanecían inmóviles y realizaban una serie de movimientos, como correr, andar, hacer flexiones, bailar,
etc. en una habitación completamente oscura. Estos movs fueron filmados en una película que se presentó posteriormente a
unos observadores para examinar si eran capaces de distinguir los distintos movimientos realizados por los actores, a partir
de la observación de los focos luminosos situados en las articulaciones. Los resultados mostraron q los observadores
podían distinguir perfectamente los movs (andar, flexionar, bailar, etc.) Sin embargo, no podían distinguir la forma (el
cuerpo humano) cuando el actor permanecía inmóvil en distintas posturas; en este caso percibían un conjunto de luces
colocadas más o menos al azar sobre un fondo oscuro.
En la misma línea, Runeson y Fryckholm analizaron la estimación de levantamiento de pesos a partir de los movimientos
que realizaban los actores. El proced consistió en la observación de una secuencia de conductas en la que unos actores
simulaban un levantamiento de pesos o lanzaban sacos de arena, utilizando la técnica ideada por Johansson. La tarea de los
observadores consistió en estimar el peso a partir de los movimientos que realizaban los actores. Los resultados obtenidos
con este proced, proporcionaron un índice fiable de la estimación del peso.
La evidencia sobre la percepción del movimiento biológico procede de estudios posteriores utilizando
técnicas similares que han permitido la identificación del sexo del actor en función de la forma de caminar,
la forma de caminar propia o la de personas conocidas. Las investigaciones en las que se ha empleado esta
técnica muestran que los bebes de cuatro meses son capaces de percibir el movimiento biológico. Por
último, estudios recientes han identificado neuronas selectivas al movimiento biológico en monos y un
aumento en la actividad del surco temporal en humanos ante la observación de estímulos similares a los
descritos en las investigaciones sobre percepción del movimiento biológico.
5.3. Movimiento propio y flujo óptico
El estudio del movimiento propio se ha desarrollado en el marco de la teoría de la percepción directa, propuesta por Gibson
que constituye un acercamiento teórico muy diferente, por lo que examinaremos algunos aspectos generales de la teoría de
la percepción directa que son relevantes para el análisis de la percepción del movimiento propio.
Desde el punto de vista de Gibson, lo importante en percepción es descubrir las estructuras de inf presentes en el medio
ambiente (la conformación óptica en el caso de la modalidad visual). En su opinión, y a diferencia de la mayor parte de las
teorías perceptivas, el análisis de los mecs de proces no es importante ya que si se conoce bien la inf real q pueden usar los
observadores, los modelos de procesamiento de la inf son innecesarios. Uno de los supuestos básicos de la teoría de la
percepción directa es que el factor determinante en la percepción es la interacción directa del observador y el objeto físico
observado. Por ello, cualquier tipo de discusión sobre atributos del estímulo próximo, transformación de la estimulación o
codificación sensorial, carece de sentido. En base a lo anterior, el modelo propuesto por Gibson, en relación con la
percepción visual, constituye un intento para determinar la forma en que la luz reflejada en los objetos físicos transmite
información acerca del medio ambiente.
El estímulo para Gibson es la conformación óptica, conjunto de rayos de luz que incide sobre el observador en un punto de
observación det. Admás, considera que en la generación del percepto, el factor casi exclusivamente determinante es el
estímulo. Por ello, en la teoría de la percepción directa, el observador atiende a la conformación óptica pero no le otorga un
significado. El significado viene determinado por el estímulo, por la escena ambiental. La conformación óptica, contiene
además información invariante sobre los cam- bios de intensidad que proporcionan información acerca del ambiente del
que procede la luz, delimitando contornos o bordes, que permitirán la percepción. Los invariantes consisten en
características relativamente permanentes de la si- tuación a pesar de los movimientos del observador.
Por otra parte, los movs del sujeto cambian el punto de vista desde el q se observan los objetos y, en consecuencia, tb se
produce un cambio en la conformación óptica. El cambio en el patrón estimular, producido como consecuencia del
desplazamiento de los observadores o del movimiento de la cabeza o los ojos, denominado flujo óptico, que se ha visto en
el capítulo 4, es el que proporciona información acerca de la naturaleza del movimiento. El flujo óptico proporciona dos
tipos de inf: sobre la distancia o perspectiva del movimiento y sobre el movimiento propio. Esta inf permite el control
visual de la locomoción, la postura y la dirección, la evitación de obstáculos, etcétera.
La percepción del movimiento propio depende del análisis del cambio continuo en la imagen retiniana a medida que nos
desplazamos en el espacio o movemos la cabeza o los ojos. Figura 5.9: ej de la sit más simple de flujo óptico, en la que el
observador fija la vista en un punto (punto de fijación) en el que está situado un objeto det y se desplaza para aproximarse
al objeto o retrocede. En el primer caso, cuando se camina hacia adelante y se fija la vista en un objeto situado al frente, el
patrón estimular característico es el q se representa en la Fig 5.9.A, en el q la flechas representan un patrón de flujo óptico
de expansión a medida que el observador se acerca al objeto. En B: ej de patrón de flujo óptico de contracción; este cambio
en el patrón estimular se produciría cuando el movimiento es de retroceso. Patrones de flujo óptico mucho más complejos
se generarían cuando el observador mueve los ojos o la cabeza al mismo tiempo que se desplaza.
Según Gibson, en la sit de la Fig 5.9, la dirección del mov vendría indicada por el denominado foco de expansión óptica q
se sitúa en el centro del patrón de flujo. Por otra parte, el foco de expansión también puede aportar inf acerca de la
distancia a la que se encuentra el objeto. Debido a la expansión, cuando nos dirigimos hacia un lugar det a una velocidad
constante, el tamaño de la imagen retiniana del objeto aumenta rápidamente a medida que nos acercamos; esto permite
determinar el “tiempo de impacto” con el objeto y evitar colisiones. El estudio de este efecto tiene importantes aplicaciones
en distintos campos, tales como la conducción de automóviles, seguridad vial, deportes, etc.
Las invests q permitieron el descubrimiento del patrón de flujo óptico se realizaron durante la 2GM cuando Gibson
diseñaba pruebas para pilotos. Observó que cuando una película filmada desde la cabina de un avión mientras aterrizaba, se
proyectaba después en una pantalla plana, se producía una deformación sistemática de la imagen de la superficie del suelo.
Sin embargo, cuando presentó la película a observadores ajenos a la investigación, éstos indicaron q no observaban
ninguna deformación sino q percibían su propio movimiento en una dirección det.
Estudios posteriores intentaron demostrar el uso del flujo óptico por parte de los observadores en rel con diversos aspectos
del mov propio. Ej: Warren, Morris y Kalish presentaron a los observadores una serie de películas en las q mediante puntos
q se desplazaban en el espacio, se simulaban los distintos patrones de flujo óptico que se generarían al caminar en distintas
direcciones. La tarea del observador consistía en proporcionar un juicio de dirección, indicando si se dirigía hacia la
derecha o hacia la izquierda de un objetivo situado en distintos lugares de la línea del horizonte. Los resultados mostraron
q los observadores fueron muy precisos en sus respuestas, incluso cuando los patrones de flujo estaban formados por muy
pocos puntos, lo que indicaría q el sistema visual puede determinar la dirección a partir del flujo óptico.
También se ha examinado si los mecanismos de expansión óptica informan de la aproximación a un objeto o posición dets.
Algunas invests realizadas con pilotos muestran que los más eficaces al realizar una tarea de simulación de aterrizajes, es
decir, los que necesitaban realizar menos maniobras y menos correcciones para aterrizar, eran aquellos que presentaban
mayor sensibilidad a los cambios de tamaño.
Por otra parte, los resultados de diversos trabajos han aportado otras características importantes como son: la percepción de
trayectorias curvas a partir del flujo óptico; que la percepción de la dirección a partir del flujo óptico es independiente de la
posición retiniana (con la excepción de una ligera ventaja en la fóvea) y que la información efectiva no es el foco de
expansión per se sino el patrón de flujo global que lo define (Warren, 1998).
Finalmente, los resultados de investigaciones sobre mecanismos fisiológicos indican que las células del área MST
responden ante sits estimulares características del flujo óptico como desplazamientos en el área frontal, rotaciones, y
patrones de expansión y contracción.
RESUMEN: La percepción del movimiento es extraordinariamente importante para una interacción adecuada del
organismo con los objetos de su entorno. Se puede percibir movimiento bajo distintas circunstancias. Cuando la percepción
del movimiento es causada por el desplazamiento del objeto se denomina movi- miento real. Las investigaciones clásicas
sobre movimiento real se han centra- do fundamentalmente en la determinación de los umbrales de movimiento. Por otra
parte, bajo el término <<ilusiones de movimiento>> se hace referencia a la percepción del movimiento bajo distintas
condiciones en las que no exis- te desplazamiento del objeto. Los posefectos de movimiento, el movimiento auto-cinético,
el movimiento inducido y el movimiento aparente, constitu- yen ejemplos de ilusiones de movimiento. La percepción de
acontecimientos, hace referencia a la percepción de movimientos complejos y encadenados, como la que se experimenta en
la percepción de la causalidad, el movimiento biológico y el movimiento propio. Finalmente, los estudios realizados sobre
mecanismos neuronales implicados en la percepción del movimiento indican por una parte, la existencia de detectores
especializados en la dirección del movimiento y, por otra parte, a nivel cortical, la intervención de las áreas MT y MST del
lóbulo temporal en la percepción del movimiento.
T.6 PERCEPCIÓN DE LA FORMA I. ORGANIZACIÓN PERCEPTIVA
Habitualmente no percibimos un mundo formado por bordes, rayas, puntos, etc., a no ser que hayamos sido entrenados, o a
menos que en alguna sit experimental se nos proporcionen instrucciones para hacer esto. Lo q percibimos es un mundo
formado por objetos estructurados, es decir, escenas mucho más complejas que las características o rasgos simples.
La percepción de objetos constituye un nivel superior a la simple detección de características en el proceso perceptivo.
La percepción de objetos del mundo real nos parece obvia y no nos plantea problemas a no ser q padezcamos deficiencias
visuales o neurológicas, pero es un proceso complejo y de difícil explicación. La estimulación que incide en los millones
de fotorreceptores de la retina es energía electromagnética, luz reflejada desde los objetos reales del medio ambiente. Esta
energía forma una imagen en la retina, imagen retiniana, q consiste en una distribución bidimensional (un mosaico) de luz
de diferentes intensidades y longitudes de onda. La inf contenida en la imagen retiniana es ambigua y no está organizada,
es decir, no contiene objetos tal y como los percibimos. ¿Cómo es posible, que podamos tener en los objetos percibidos un
reflejo tan exacto de los objetos del mundo real a partir de la inf contenida en la imagen retiniana? Este es el problema
básico en la percepción de la forma y su objetivo de estudio es comprender los procesos por medio de los cuales el sistema
visual genera la experiencia perceptiva de un objeto a partir de la inf contenida en la imagen retiniana.
Pero los procesos que subyacen a la experiencia perceptiva no se pueden identificar con los fenómenos de la percepción de
la forma. Los fenómenos de los que se ocupa la percepción de la forma, son el resultado del proceso perceptivo, incluyen
tanto la experiencia perceptiva del observador como los datos obtenidos mediante la utilización de tareas experimentales en
el agrupamiento, segregación de la textura, discriminación de formas, etc. En los capítulos dedicados a percepción de la
forma se examinarán algunos ejs de fenómenos que constituyen el resultado de los procesos perceptivos y, a partir de los
cuales, se puede inferir la actuación de una serie de mecs y procesos q el sistema visual utiliza para extraer, interpretar y
dar significado a la información sobre los objetos del entorno. Uno de estos mecanismos, la organización perceptiva,
facilita la extracción de regularidades presentes en los objetos naturales, permitiendo así la segregación y agrupamiento de
la estimulación necesarias para la percepción del objeto. Otros procesos nos facilitan el desenvolvimiento en el entorno.
Entre estos, los procesos de detección, nos permiten descubrir la presencia de uno o varios objetos en el entorno (ej: si
caminamos en la oscuridad es importante que podamos descubrir la presencia de obstáculos en nuestro camino). Un
proceso más complejo que el anterior es el de discriminación que nos permite diferenciar un objeto de otro y, de este
modo, seleccionar la información relevante en un momento determinado o para realizar una acción específica. Ej: si
estamos conduciendo es necesario discriminar las señales que indican un peligro de aquellas otras señales que indican solo
una información, esto puede realizarse simplemente discriminando la forma o el color de las señales. Finalmente, los
procesos más complejos, identificación y reconocimiento, permiten determinar con exactitud el objeto en cuestión; ej:
para abrir la puerta es imprescindible no sólo distinguir unas llaves de otras sino tb identificar y reconocer la llave
apropiada, e implican la intervención de procesos plógicos como la representación en la memoria de una imagen det.
Los procesos de detección, discriminación y rec están jerarquizados en cuanto a su func y al grado de inf estimular que
requieren. En relación con el func, los procesos más complejos requieren la intervención de los más simples. No podemos
discriminar un objeto de otro si previamente no lo hemos detectado, tampoco reconocer un objeto si previamente no lo
hemos detectado y lo hemos diferenciado de otros objetos presentes en el entorno. En cuanto a la jerarquía en el grado de
inf q requieren los procesos, los más complejos requieren inf estimular más precisa que los procesos más simples.
1. ORGANIZACIÓN PERCEPTIVA La definición de org perceptiva difiere de unos a otros x su posición teórica.
Teoría de la Gestalt: el conjunto de fs o condiciones q permiten la constitución del objeto percibido.
Lo común a todas las posturas teóricas es la preocupación por dar respuesta a dos preguntas básicas que se han planteado
los científicos desde los inicios de la Psicología Experimental en relación con la percepción de la forma:
1) para poder percibir un objeto es necesario distinguirlo del contexto así como de otros objetos presentes ¿cómo se
segregan las unidades estimulares unas de otras para dar lugar a la percepción de objetos distintos y diferenciados?
2) si la inf en la imagen retiniana es ambigua ¿cómo se agrupan los elementos estimulares discretos e inconexos para dar
lugar a unidades perceptivas más amplias como objetos o superficies?
1.1 Principios de organización perceptiva
En rel con estas 2?, la Gestalt desarrolló una serie de principios q describen cómo se llevan a cabo dos mecs básicos de la
org perceptiva: la segregación de objetos, o percepción de la figura y el fondo, y el agrupamiento de elementos
estimulares discretos e inconexos en unidades perceptivas más amplias o agrupamiento perceptivo.
- Principios de segregación de la figura y el fondo: La segregación de objetos consiste en la percepción de una figura que
se destaca sobre un fondo y se considera como el tipo de org perceptiva más elemental. Descubierta x Rubín a partir de sus
trabajos con figuras reversibles como la presentada en la parte superior de la Fig 6.1, en la q se puede percibir una copa o
dos caras_ En esta fig se pueden diferenciar dos regiones, una blanca q corresponde a la fig de la copa, y otra negra, a de
las caras. Las dos regiones están delimitadas por un contorno (límite entre la parte
blanca y la negra). Véase que cualquiera de las dos partes representa en esta fig puede
actuar de figura o de fondo dependiendo de que el sistema visual asigne el contorno a
una de las dos regiones. Si se asigna el contorno a la parte blanca se percibirá la copa
como figura. Por el contrario, si se asigna a la parte negra se percibirán las caras. Sin
embargo, es imposible percibir las dos partes como figura o como fondo a la vez. Si
se percibe la copa como figura no se pueden percibir las caras al mismo tiempo, sino que éstas se perciben como fondo.
Por el contrario, si se perciben las caras como figura, la copa pasa apercibirse inevitablemente como fondo. En la parte
inferior de la figura si se percibe un candelabro se puede percibir a la vez una cara de frente, pero resulta difícil percibir las
dos caras de perfil. A su vez, si se perciben las dos caras de perfil resulta muy difícil percibir el candelabro.
Otros ejs de este principio lo encontramos en algunas obras de arte como las conocidas obras de Escher en las que se
alterna la percepción de figuras (véase Figura 6.2).
Las invests de Rubín consistieron en observaciones y descripciones fenomenológicas sobre las
impresiones de los observadores cuando se les presentaban Es como los descritos antes llamados
figuras reversibles. A partir de aquí desarrolló una serie de descripciones sobre las características
diferenciales de la figura y el fondo según los cuales, la figura y el fondo se diferencian en:
a) la figura tiene carácter de objeto, el fondo no.
b) la figura tiene forma, el fondo no. La forma de la figura procede del contorno que la delimita,
ej en las figuras reversibles presentadas en la parte superior de la Fig1 la asignación del contorno
a la parte blanca o negra determina q esa parte se perciba cm figura.
c) la figura tiene color de superficie mientras que el fondo es menos denso;
d) la figura está localizada frente al fondo.
e) resulta más fácil discriminar figuras entre sí que fondos.
f) la figura se conecta más fácilmente a significados que el fondo.
Rubín y dp otros, establecieron a partir de sus invests, las condiciones estimulares q permiten
predecir qué partes del campo visual se percibirán como figura o como fondo. Estas condiciones
estimulares fueron llamadas x los de la Gestalt “principios de organización de la figura y el fondo” (Cuad 6.1). Ejs Fig 6.3.
CUADRO 6.1. Principios de organización gura-fondo
Áreas envolventes y envueltas. Las áreas envueltas tenderán a percibirse como gura y las
envolventes como fondo.
Simetría. Las áreas que presentan simetría en su eje vertical tenderán a percibirse como
guros con mayor facilidad que las que no la presentan.
Áreas convexas y cóncavas. Las áreas convexas tenderán a percibirse como guros con
mayor probabilidad que las cóncavas.
Orientación. Las áreas orientadas vertical-horizontalmente se perciben como ggros con
mayor facilidad que las oblicuas.
Tamaño relativo. Las áreas de menor tamaño tenderán a percibirse como gu- ra con
prioridad a aquellas que presenten un tamaño mayor.
Contraste. Las áreas que presenten mayor contraste con el contorno global se percibirán
más fácilmente como guros que aquellas que presenten menos contraste.
- Principios de agrupamiento perceptivo: desarrollados por Wertheimer, quien advirtió que, a igualdad de otras
circunstancias, los elementos estimulares discretos e inconexos cuando se presentan simultáneamente tienden a percibirse
como patrones o unidades perceptivas más amplios o distintos, en función de determinadas propiedades. Es decir, se trata
de la reunión de dets elementos estimulares que comparten alguna propiedad común en unidades perceptivas distintas.
Ej: en la parte superior de la Fig 6.4, la organización percibida es ambigua porque en este caso puede percibirse desde un
cuadrado formado por puntos hasta distintas organizaciones alternativas: filas, columnas o diagonales de puntos, aunq la
percepción de estas orgs alternativas requiera un esfuerzo y no sea tan evidente como la primera. Sin embargo los
elementos estimulares discretos se pueden agrupar en función de una serie de principios (Cuadro 6.2). En la fig 6.4 se
presentan algunos ejs de estos principios.
Palmer, ha sugerido una clasificación de los principios de agrupamiento perceptivo:
- principios de agrupamiento intrínseco, se encuadran la mayoría de los principios clásicos de la Gestalt, y según los cuales,
los elementos estimulares discretos se agrupan en unidades perceptivas más amplias o distintas en función de su
proximidad, semejanza en color, forma, tamaño, etc.
- principios de agrupamiento extrínseco, en los q los els estimulares discretos se agrupan y forman unidades perceptivas
distintas en función de la actuación de elementos externos añadidos al E inicial. Ej: el hecho de encerrar los els estimulares
discretos en una figura geométrica, puede determinar q se agrupen (principio de región común), o, el hecho de q se
conecten los distintos elementos, puede producir que se perciban como una unidad (principio de conexión o cohesión de
elementos). Estos 2 principios de agrupamiento extrínseco han sido propuestos por Palmer y Rock (Fig 6.4). Finalmente,
los principios de agrupamiento tb pueden diferenciarse según la cohesión del percepto resultante de su actuación. Ej: en
algunos principios de agrupamiento intrínseco como semejanza y proximidad y en el principio extrínseco de región común,
se forman agregados perceptivos en los q los els se perciben con una relativa independencia, mientras q en el principio
intrínseco de buena continuación y en el extrínseco de conexión se percibe un objeto más cohesionado (Palmer, 1999)
CUADRO 6.2. Principios de agrupamiento perceptivo
Proximidad. Los elementos más próximos tienden a agruparse entre sí forman- do unidades perceptivas distintas.
Semejanza. Los els más semejantes tenderán a agruparse entre sí. La semejanza puede ser de forma, color, tamaño, orientación etc. y la
conjunción de varias dims llevará a un agrupamiento más o menos potente. Cierre. Las formas cerradas tienden a percibirse con
preferencia a las formas abiertas.
Buena continuación. Se tiende a percibir cambios suaves en la estimulación con preferencia a cambios pronunciados.
Destino común. Los elementos q presentan una misma pauta de mov se percibirán como formando una misma unidad perceptiva.
Los principios de org perceptiva propuestos por la Gestalt han sido considerados por algunos autores como regularidades q
usa el sistema visual para organizar la inf ambigua. Estas regularidades, además, constituyen propiedades de los objetos.
Cuando observamos una mesa la distinguimos como figura en un entorno det (figura-fondo), la percibimos cm un objeto
compacto formado x distintos elementos (tablero, patas, travesaños, etc.); a su vez percibimos las uniones de estos
elementos (proximidad), las partes q son similares y diferentes (tablero frente a patas); y seguimos percibiendo la mesa
como un único objeto aun en el caso de q uno de los travesaños esté despegado (cierre).
- Limitaciones de la Teoría de la Gestalt: La principal aportación de la Gestalt a la percepción fue la observación de dets
fenómenos perceptivos y la descripción de las condiciones bajo las cuales se percibe una det org. Limitaciones teóricas:
1) los principios de org perceptiva de los gestaltistas han sido considerados vagos e imprecisos. Consecuencias:
- q los principios no se apliquen siempre de la misma forma ante los mismos fenómenos. Ej: en las figuras reversibles o
ambiguas, el esfuerzo del observador en dirigir la atención hacia una parte det del estímulo puede hacer que se inviertan las
relaciones entre la figura y el fondo percibiéndose lo que en un principio aparecía como figura como fondo y viceversa.
- q se puedan aplicar principios de org perceptiva que presentan una contraposición teórica a un mismo patrón estimular.
Ej: frecuentemente los principios de simetría y convexidad, que intervienen en la segregación de la figura y el fondo,
entran en conflicto, prevaleciendo generalmente el principio de convexidad sobre el de simetría, lo cual iría en contra del
principio teórico de la Gestalt según el cual se percibirá la organización más simple posible.
2) los principios son meramente descriptivos y no se ha desarrollado una teoría general que proporcione una explicación
sobre los mismos. La falta de explicación de los principios se ha atribuido, a la escasa experimentación y a la metodología
q consistió fund en demostraciones fenomenológicas. Este proced consistía en presentar a los observadores un patrón como
el de la parte superior de la Fig 6.4, que no produce un agrupamiento det, y patrones semejantes a los q se presentan en la
misma figura (A, B, C y D) y en los que se puede percibir una org det, en virtud del
agrupamiento de los elementos en base a dets propiedades (color, tamaño, forma y
proximidad) y los observadores tenían q informar de la org percibida en cada uno de
ellos. Este proced presenta el inconveniente de q al estar basado en la impresión subjetiva
no permite determinar objetivamente q una R sea o no correcta, ni obtener datos
numéricos q permitan contrastar las teorías.
Pero en rel con las críticas a la metodología, señalar por una parte, q algunos autores
consideran las demostraciones de la Gestalt como auténticos experimentos. Según Rock,
la manipulación en los Es puede considerarse como una VI, mientras q la VD consistiría
en el percepto q se obtiene como consecuencia de esta manipulación. Por otra parte, se
han desarrollado métodos de cuantitativos en el estudio del agrupamiento, q permiten
paliar algunas de las dificultades señaladas.
Pero algunos de los problemas planteados por la Gestalt siguen siendo problemas funds
en el ámbito de la percepción. El estudio de las rels entre el todo y las partes, los efectos
de superioridad del objeto y de superioridad configuracional, el proces de aspectos
globales y locales de los patrones visuales jerárquicos, la segregación perceptiva en base a la textura y las rels entre mecs
de selección atencional y org perceptiva, constituyen algunos ejs del interés actual de los investigadores en los problemas
planteados en el seno de la Gestalt reflejado en el notable volumen de invest desarrollado desde los 80, hasta ahora.
2. DESARROLLOS POSTERIORES EN EL ESTUDIO DE LA ORGANIZACIÓN PERCEPTIVA
La mayoría de invests posteriores han intentado dar explicaciones teóricas bsadas en la ejecución en tareas experimentales.
2.1. Investigaciones sobre la segregación de la figura y el fondo
han dedicado menos at a las diferencias fenomenológicas entre estas dos regiones del campo visual y se han centrado en el
análisis de los mecs q las diferencian y en encontrar una explicación a este fenómeno basada en el procesamiento de la inf.
- Componentes de frecuencia espacial y segregación de la figura y el fondo
Julesz sugirió sistemas o mecs diferentes de proces para la percepción de la figura y el fondo. Partiendo de las
descripciones fenomenológicas de la Gestalt q afirman q la figura está más articulada y tiene carácter de objeto, mientras q
el fondo no presenta estas caracs, y de la predicción de q la región del campo visual q presente más detalles se percibirá
como figura, Julesz propuso que el proces de la figura se caracterizaría x un análisis de los detalles de la imagen, mientras
que el procesamiento del fondo por un análisis de estructuras más globales. Ahora sabemos a través de los resultados de
estudios psicofísicos, q la zona espectral q contiene frecuencias espaciales altas contiene inf sobre los detalles de la imagen
(características de grano fino), mientras q la zona espectral q contiene frecuencias espaciales bajas lleva inf sobre aspectos
globales de la imagen (características de grano grueso).
Algunos investigadores han tratado de analizar si existe una asociación entre los cs de frecuencia espacial de las imágenes
y la percepción de la figura y el fondo. Wong y Weisstein diseñaron una sit experimental en la q presentaban líneas nítidas
(características de grano fino de la imagen) o borrosas (características de grano grueso de la imagen) en las dos regiones de
una figura reversible, en la figura de la copa y las caras de Rubin. La tarea consistía en detectar líneas
nítidas o borrosas cuando se presentaban en el contexto de la figura o en el del fondo. En la parte superior
de la Fig 6.5 se presenta la región del campo visual (A, B o C), en la q se presentaba la línea a detectar.
Cuando se presentaba en A, la copa era la figura, cuando se presentaba en B y C, las caras eran la figura.
Los resultados mostraron q las líneas nítidas, que presentarían cs de alta frecuencia espacial, se detectaban
mejor en el contexto de una figura que en el de un fondo. Por el contrario, cuando la línea era borrosa, es
decir presentaba cs de baja frecuencia espacial, se detectaba mejor en el contexto de un fondo.
Klymenko y Weisstein analizaron la influencia de los cs de frecuencia espacial en la percepción de la figura
y el fondo. Utilizaron también figuras reversibles pero además rellenaron las regiones correspondientes a la
figura y el fondo con enrejados sinusoidales de distinta frecuencia espacial (parte inferior de la Fig 6.5).
Registraron el nº de veces q cada región se percibía como figura y como fondo en función de q se hubiera
rellenado el espacio con enrejados de altas o bajas frecuencias espaciales. Los resultados indicaron q la región rellena con
enrejados de alta frecuencia espacial (las caras en el ej presentado aquí) se percibían como figura un mayor nº de veces.
Los resultados anteriores apoyan la hipótesis de una diferencia funcional entre la percepción de la figura y el fondo según
la cual cada proceso sería responsable de un tipo de proces visual y sensible a diferentes tipos de inf. El análisis de la fig se
caracterizaría por una inspección detallada de las áreas más pequeñas del campo visual y la inf relevante en este caso serían
los detalles y los contornos. El análisis del fondo sería responsable de la extracción de la inf global del campo visual.
- Asignación unilateral de bordes
En relación con la explicación de la segregación de la figura y el fondo basada en el procesamiento de la inf, una serie de
autores han considerado qué tipo de procesos, preatencionales o atencionales, intervienen en el análisis de la figura.
Driver y Baylis, intentaron determinar el papel de la asignación de bordes a la región de la figura o a la del fondo. Como
hemos visto, cuando se observa la figura de la copa y las caras se percibe un único objeto, o la copa o las caras, pero no las
dos figuras a la vez. Los teóricos de la Gestalt lo atribuían a q el sistema perceptivo impone un orden en la estimulación.
Pero Driver y Baylis proponen q los bordes que dividen regiones adyacentes del campo visual se asignan unilateralmente,
es decir, se asignan a un único lado. Este supuesto fue puesto a prueba en una serie de experimentos en los que se
presentaban estímulos similares a los de la Fig 6.6. En estos Es, un borde (línea quebrada entre la zona clara y oscura)
divide el rectángulo en 2 partes, 1 más pequeña y oscura y 1 más grande y clara. El
borde se puede asignar a cualquiera de las dos regiones del E, la figura o el fondo,
y una vez asignado a una de las partes se denomina contorno que delimita la figura,
si se asigna a ésta, o contorno que delimita el fondo, si se asigna al fondo.
Por otra parte, y de acuerdo con los principios de org de la figura y el fondo
postulados por la Teoría de la Gestalt, el tamaño relativo y el contraste
determinarían q la parte más pequeña y con más contraste del E tienda a percibirse
como figura y la parte más grande y con menor contraste como fondo. Por tanto,
en los Es (A) y (B), de la fig 6.6, la parte más pequeña se percibirá como figura y
la más grande y clara como fondo.
En los experimentos se presentaba 1º un estímulo similar a los (A) y (B), llamado
E previo, y una vez desaparecía el E previo se presentaba inmediatamente uno de
los Es de comparación (C, D, E, ó F). La tarea era comparar si los bordes del E previo y de comparación, eran iguales o
diferentes. Ej: en la Fig 6.6, si el E previo era (A), el E de comparación (C) presentaría un borde igual al asignado a la fig y
el estímulo (E) presentaría un borde diferente; mientras q los bordes presentados en (D) y (F) corresponderían al fondo (D,
presentaría un borde igual al del fondo y F un borde diferente). Lo contrario ocurriría si se presentara (B) como E previo,
puesto q, la parte pequeña situada a la derecha tendería a percibirse como figura, por lo que los Es (D) y (F) serían los Es
de comparación para la figura (D, sería el igual y F el diferente) y los Es (C) y (E) para el fondo (C, igual y E, diferente).
Se dieron instrucciones a los observadores para q atendieran sólo al borde como si se presentara una única línea quebrada
prescindiendo del resto del E, tanto en el E previo como en el de comparación. Pero de acuerdo con la hipótesis de
asignación unilateral de los bordes, se predijo que la atención selectiva a la línea quebrada resultaría imposible dado que
siempre se percibiría una figura delimitada por un contorno. Y se predijo que los observadores rendirían mejor en la tarea
de comparación cuando los Es de comparación correspondieran a las figuras que cuando correspondieran a fondos. La
predicción se basa en que, según esta hipótesis, el borde se asigna a un único lado y, de acuerdo con la manipulación
realizada sobre el E previo, la parte más pequeña se percibiría como figura desde el principio, por lo que sería más fácil
reconocer el contorno que la delimita en la tarea de comparación. Es decir, se produciría una ventaja en el rec del contorno
que delimita la figura desde el momento en q ésta se presenta como E previo. Esta predicción sólo podría mantenerse en el
caso de q los observadores no atendieran exclusivamente a la línea quebrada que divide el E en dos partes y la asignaran a
una de ellas. Si atendieran únicamente a la línea quebrada, la ejecución en la tarea de comparación de contornos, sería igual
en los dos casos, puesto q la ventaja de asignar el borde a la figura cuando se presenta el ensayo previo desaparecería, y los
juicios de comparación de contornos serían iguales.
Resultados: sugieren q los observadores asignaron el borde a un único lado dl campo visual, el correspondiente a la figura.
Esta operación tuvo consecuencias en la ejecución, los sujetos rendían mejor (empleaban menos tiempo y cometían menos
errores) cuando juzgaban si el contorno de la figura era igual al de comparación, que cuando juzgaban si el contorno
correspondiente al fondo y el de comparación eran iguales. Resultados obtenidos con Es en los q se definía la figura en
base a otros principios de org, como simetría y convexidad, confirmaron la hipótesis de asignación unilateral de bordes.
Conclusión: la asignación d los bordes q dividen la figura y el fondo es unilateral y espontánea y no depende d la atención.
- Influencia de los procesos de reconocimiento en la segregación de la figura y el fondo
La mayoría de las teorías de la percepción visual han defendido que la segregación de la figura y el fondo constituyen un
paso previo al proceso de rec del objeto. Parece obvio, q para poder reconocer un objeto, es necesario antes segregar ese
objeto del fondo o de otros objetos presentes en el campo visual y, una vez hecho, compararlo con una representación en la
memoria. Esta afirmación ha sido puesta en cuestión por Lowe y fund a través de las invests de Peterson y cols.
Peterson, Harvey y Weidenbacher presentaron estímulos reversibles, en los que se podía invertir la figura y el fondo. Se
trataba de un rectángulo que contenía una parte central negra rodeada por unas partes laterales en blanco, parecido al
estímulo de la copa y las caras de Rubín. La tarea consistía en observar los estímulos durante un det tiempo e informar
cada vez que se produjera una inversión, es decir siempre que la región del campo visual que se estaba percibiendo como
figura cambiara a fondo o vs. En una serie de ensayos se daban instrucciones para q intentaran ver la parte central como
figura; en otra serie de ensayos se les instruía para que intentaran ver las partes laterales como figura. Los resultados
mostraron que los observadores percibían la parte central como figura un mayor nº de veces. En otra serie de ensayos
manipularon los Es de manera que las dos partes del mismo estuvieran igualadas en los fs que determinan la formación de
la figura como área, tamaño relativo, etc., pero las zonas correspondientes a la figura (parte oscura del estímulo) y al fondo
(partes laterales blancas del estímulo) en algunas ocasiones se parecían a un objeto familiar y en otras no se presentaba esta
propiedad (ver Fig 6.7). Los resultados indicaron que las zonas del estímulo que se parecían a objetos familiares se
percibían con mayor frecuencia como figura. Sin embargo, al presentar los mismos Es en una
posición invertida, en la que ya no podían ser reconocidos como objetos familiares, el efecto
desaparecía. Los autores lo interpretaron como evidencia a favor de que el procesamiento de
objetos familiares puede comenzar con anterioridad a que se haya completado la segregación de
la figura e influir en ésta.
A raíz de estos resultados propusieron un modelo para los procesos de reconocimiento prefigural,
según el cual los procesos de rec q contribuyen a la segregación de la figura y el fondo actuarían
sobre los bordes (cambios abruptos en intensidad, representados por las líneas que separan las
partes blanca y negra de los estímulos presentados en la Fig 6.7) que dividen el campo visual y no
sobre los contornos ya asignados a la figura o el fondo. Una vez detectados los bordes, los
procesos de rec actuarían sobre las zonas situadas a ambos lados de los mismos influyendo en la
segregación de la figura y el fondo. El modelo no supone q el proceso completo de rec de la
figura se complete con anterioridad a la segregación de la figura y el fondo, sino que algunos procesos de rec actúan en
paralelo al proceso de segregación de las dos partes del campo visual. Esta propuesta es compatible con la teorías del rec
basadas en la detección de bordes que veremos en el cap de reconocimiento visual, la diferencia entre ambas radica en el
hecho de que estas últimas teorías consideran q la segregación de la figura y el fondo es un proceso previo al de rec de las
formas visuales mientras q la teoría de Peterson es interactiva.
2.2 Investigaciones sobre agrupamiento perceptivo
Las invests experimentales sobre agrupamiento perceptivo se iniciaron en los 50. Nos centraremos en algunos desarrollos
más recientes centrados en el procesamiento de la inf, examinando algunos estudios sobre agrupamiento perceptivo
desarrollados en el ámbito de la Psicología Cognitiva y algunas contribuciones desde la teoría computacional de la visión.
- Agregados perceptivos y configuraciones
El agrupamiento perceptivo de elementos estimulares discretos e inconexos permite la formación de 2 tipos de unidades:
1) Agregados perceptivos, son unidades perceptivas formadas en base al agrupamiento de elementos discretos e
inconexos que presentan una propiedad común (elementos semejantes, próximos, etc.).
2) Configuraciones, son unidades perceptivas distintas a los elementos de que están formadas y en la que se percibe la
relación entre las partes. De la percepción de estas relaciones surgen propiedades emergentes que son distintas a los
elementos componentes, y que no se pueden explicar en base a los mismos. Ej: la percepción de un rostro no es siempre la
misma, aunque todas las caras posean los mismos elementos: dos ojos una boca una nariz, etc.
En la parte superior de la Fig 6.8 se presentan los elementos estimulares discretos, dos
paréntesis abiertos a la derecha o a la izquierda.
En A: un ej de agregados perceptivos, en este caso los elementos estimulares discretos se
agrupan por proximidad.
En B: ejemplos de configuraciones. Como se ve, el agrupamiento de los els discretos da
lugar a unidades perceptivas distintas y diferenciadas. Además la percepción de rels entre
los els discretos da lugar al surgimiento de propiedades emergentes como la simetría en el
estímulo 4 )(, repetición en 1 ((y 2 )) y la simetría y el cierre en el estímulo 3 ( ).
Se han considerado como propiedades emergentes los siguientes tipos: relaciones entre los
elementos componentes de los estímulos que dan lugar a simetría, cierre, repetición,
reflexión, intersección, y conjunción de elementos; relaciones espaciales entre los
contornos, como la intersección de líneas y los extremos de las mismas; la orientación
tridimensional de las superficies; las claves pictóricas de profundidad; la dirección de la
iluminación de la escena; y la percepción de profundidad estereoscópica. Sin embargo, esta
enumeración no agota el nº de propiedades emergentes y es posible que en futuras invests
se descubran algunas otras no contempladas.
Tomando como punto de partida esta distinción examinaremos las invests de Pomerantz
sobre agrupamiento perceptivo. Uno de los supuestos básicos de los que parte Pomerantz es
la consideración del agrupamiento como una operación efectuada sobre los estímulos. En
consecuencia, sus efectos pueden reflejarse en la ejecución en tareas experimentales y esto
permite obtener una medida del agrupamiento a través de la ejecución en dichas tareas.
El primero de los trabajos que vamos a examinar está en relación con el problema de la
configuración de los estímulos. El supuesto general fue: cuando en un patrón estimular los
elementos componentes se organizan en una configuración, debería resultar muy difícil o
imposible el procesamiento independiente de los elementos del patrón estimular por
separado. En consecuencia, se predijo que la atención selectiva a los elementos componentes de la configuración sería muy
difícil o imposible cuando los elementos componentes forman una configuración. Los Es utilizados fueron los paréntesis
presentados en la Fig 6.8. Los Es se dibujaron en tarjetas y la tarea de los sujetos consistía en clasificarlas en dos grupos,
de acuerdo con las instrucciones que les daba el experimentador. De igual modo se les indicaba q atendieran
exclusivamente al elemento componente q permitía discriminar un E de otro y que ignoraran los demás. Las condiciones
experimentales se presentan en el cuadro 6.3 y Fig 6.9.
Resultados: los Es se clasificaron más rápidamente en la condición de control q en la de atención selectiva. Esto refleja q la
atención selectiva a los elementos componentes del estímulo x separado resultó imposible, ya q si se hubiera atendido
exclusivamente al elemento componente relevante para realizar la discriminación, los tiempos de clasificación hubieran
sido iguales en las condiciones de control y atención selectiva. Así, los resultados indican que los Es se agruparon
percibiéndose como un todo y no como elementos
componentes del E.
En un 2º estudio transformaron los Es rotando 90° el
elemento derecho. Las tareas fueron iguales a las del
estudio citado. Los resultados mostraron que el
tiempo empleado en las dos condiciones (control y
atención selectiva) era similar y, en consecuencia, los
elementos estimulares no se agruparon y se percibían
como elementos separados. Sin embargo, otros
autores (Rock, 1986), consideran una interpretación
alternativa a estos resultados. En opinión de este
autor, los estímulos presentados en este experimento
son agregados perceptivos. En este caso, como hemos
señalado, los paréntesis se agrupan por proximidad y
se perciben como una unidad, aunq no forman
configuraciones como en el estudio anterior. Por lo
tanto, lo q indican los resultados en este caso, es que
se puede atender selectivamente a los elementos
estimulares cuando se agrupan formando agregados
perceptivos pero esto no es posible cuando los els
estimulares se agrupan formando configuraciones,
como en el 1r experimento citado, q presentan
propiedades emergentes y determinan que el E se
perciba como un todo con una forma propia de la que
no se pueden aislar los elementos.