Вы находитесь на странице: 1из 44

Antonio García Megía

Angarmegia: Ciencia, Cultura y Educación


http://angarmegia.com
angarmegia@angarmegia.com
LA PONDERACIÓN DE LA POSICIÓN
Y LOS COEFICIENTES DE
DISPONIBILIDAD LÉXICA.
CONVENIENCIA DE ENSAYAR OTROS
PROCEDIMIENTOS DE CÁLCULO
EL MODELO PROBABILÍSTICO DESARROLLADO
POR ANTONIO GARCÍA MEGÍA
Tercera Parte

OTRO MODO DE CALCULAR LOS COEFICIENTES:

UNA FÓRMULA ALTERNATIVA


ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Para alcanzar el nuevo protocolo paradigmático de números y operaciones que aquí se


propone, capaz de representar suficientemente el poder de las relaciones que condicionan la
producción lingüística y derivar en una fórmula que genere un indicador más fiable y objetivo
de los coeficientes de disponibilidad léxica, se tiene presente que:

1. El carácter matemático de la construcción impone la sumisión absoluta a las reglas


que organizan el dominio numérico que aporta generosamente las herramientas, pero
establece claramente los límites de su uso.
2. La actuación sobre una muestra representativa conlleva un error sistemático que es
preciso aceptar y medir.
3. Los datos no resultan de la observación de un hecho espontáneo, sino de una situación
provocada en laboratorio, lo cual fuerza a discriminar con precisión qué elementos
significativos lo son de acuerdo con su presencia efectiva en el acto de la
comunicación, y cuáles nacen de la subjetividad del investigador o son inherentes al
método.

Se acude al ámbito de las probabilidades, pero lejos de la concepción más tradicional y


al uso que la entiende al modo y manera de un juego de azar. No se trata de extraer una bola
roja del interior de una urna, ni de predecir la posibilidad de elegir el as de corazones entre el
conjunto de naipes que constituyen la baraja francesa. Se contemplan actos volitivos,
cargados de humanidad y condicionados por la cultura, los intereses, los sentimientos, las
sensaciones y hasta la capacidad fisiológica e intelectual de cada sujeto cuyo comportamiento
se analiza. Por eso se busca siempre el apoyo de postulados y teoremas extraídos del campo
de la probabilidad a posteriori que oferta instrumentos más sensibles a esta realidad.
Existen dos enfoques a la hora de afrontar problemas de probabilidad. El modo más
clásico de interpretar las manifestaciones del azar se denomina probabilidad a priori. Este
planteamiento es capaz de aventurar una hipótesis que establece la eventualidad de ocurrencia

4
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

de un suceso aleatorio antes de que se produzca, es decir, a priori. En su forma más simple
prevé, y cuenta, todas las variables posibles del hecho y las relaciona con aquellas que son
favorables, esto es, las que cumplen la condición que se ha establecido o se pretende medir.
Sus predicciones son del tipo: la probabilidad de ocurrencia del suceso “s” es de “p” veces
favorable por cada “n” intentos [RÍUS; BARÓN; SÁNCHEZ y PARRAS. 1995]. Se cuantifica a partir de
la ecuación que, a principios del siglo XIX [LAPLACE, P. S. 1812; 1825], enuncia Pierre Simón
de Laplace:

ρ (A ) p (sucesos favorables de A)
n (sucesos posibles )

En el lanzamiento de un dado, la probabilidad del suceso “A = 1" es 1/6, supuesto que


tenga seis caras (casos posibles) y sólo una cumpla la condición requerida, “es 1" (casos
favorables). El grado de confianza del vaticinio se establece en proporción directa con el
número de tentativas o repeticiones. Se cumple sólo para grandes valores de “n”.
El segundo punto de vista contempla la probabilidad desde una óptica más frecuentista
que no sabe previamente de casos posibles ni favorables. En la probabilidad a posteriori la
eventualidad teórica de ocurrencia de un fenómeno queda matizada por la información que
aportan experimentos ya concluidos. En el ejemplo anterior se partiría del desconocimiento
del número de caras que tiene el dado y de cuántas de ellas cumplen la condición “es igual a
1". La medida de la posibilidad de ocurrencia del suceso se deduce sólo a partir de lo
acontecido en experiencias terminadas, por lo que, a medida que éstas se incrementan, se
ajusta el guarismo que la concreta.
La probabilidad a posteriori acepta como contingencia de un suceso su frecuencia
relativa después de observado un número estadísticamente suficiente de veces [RÍUS; BARÓN;

SÁNCHEZ y PARRAS. 1995]. Sus expresiones suelen ser del tipo: el suceso aleatorio “s” ha
ocurrido “f” veces en “n” intentos. Las conclusiones son fácilmente extrapolables a
situaciones producidas en condiciones parecidas. El cálculo, en este caso, responde a la
fórmula:

5
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

f (frecuencia de aparición de A)
ρ(A)
n (total de casos observados)

Si se admite que la posición de un vocablo en una lista es el indicador más cualificado


para subrayar su tendencia a aparecer en un contexto temático, la palabra más disponible será,
con certeza, aquella que encabece la relación; a continuación se situará la segunda, luego la
tercera... En lógica consecuencia, el valor significativo del lugar de aparición decrece a
medida que avanza el listado. Este principio no resta relevancia a la frecuencia, sino que la
pondera de acuerdo con la importancia que otorga al orden de las actualizaciones. La
frecuencia expresa de manera incuestionable la cantidad de individuos que conocen una
palabra, la posición, en cambio, la fuerza de seducción que ejerce, en cada caso, el tema. El
índice de disponibilidad debe combinar de forma adecuada ambas referencias.
La diferencia del método tradicional de cálculo del coeficiente de disponibilidad con el
que aquí se oferta, estriba en que no estima el elemento posición a partir de un patrón de
variación continuo, uniforme y permanente, dependiente de constantes moderadoras de la
frecuencia, en la línea de la tasa de sustitución, sino como respuesta única, personal, y,
posiblemente, irrepetible, condicionada por la actuación sobre el hablante de estímulos y
elementos internos, externos y temporales, como el funcionamiento de la memoria, los
mecanismos de asociación verbal, la estación del año...
En consecuencia con el criterio expuesto, la primera palabra es la única que surge
como respuesta inmediata a la incitación inicial. Las siguientes derivan de situaciones cada
vez más complejas y condicionadas. La motivación que arranca la cadena lingüística es
sucesivamente modificada, y enriquecida, por las sugerencias y connotaciones que añaden, en
conjunto o de forma aislada, todos los términos que se han actualizado. Cada aportación es
consecuencia del papel activo que desempeña, por sí misma, dentro del campo semántico en
que se produce, pero también de su relación con el mundo personal de significación afectiva
que suman todas las precedentes a la situación comunicativa.
Se podrán compartir, o no, posturas conductistas para explicar el fenómeno lingüístico
en su integridad, pero no parece cuestionable que los resortes asociativos influyen en los actos
de habla y tienen una alta repercusión en el cálculo de la disponibilidad, especialmente en el
ámbito del método. El repaso de los listados prueba que, generalmente, a “blanco” sigue
“negro” y a “perro”, “gato”. También deja patente que triadas como “cuchillo”, “cuchara” y

6
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

“tenedor”, se relacionan con tal fuerza que constituyen un todo casi indivisible. La evidente
presencia del fenómeno de la asociación verbal no contradice, sino que refuerza, la atribución
de valores decrecientes a la secuencia posición.
Convenido esto, el problema de cuantificar la posición pasa, ante todo, por decidir el
modelo matemático a partir del cual se articulen los cálculos. Los habituales interpretan la
relación peso-posición como una función:

y f(x)

donde: y es peso de la posición


x es posición
f es constante.

El peso de la posición, variable y, responde siempre a f, operación o conjunto de


operaciones que se realizan a partir de la posición, variable x.

En este caso se encuentran la tasa de sustitución, “la razón entre una variación en la
frecuencia relativa en la primera posición y el cambio necesario en la siguiente posición para
compensar la variación” [BUTRÓN, G. 1987:39], o el coeficiente de dispersión. Ambos se
construyen como funciones exponenciales.
La primera propone

Tasa de sustitución λi 1

donde λ es un valor constante


i es posición

que claramente responde a la función

x 1
y λ

donde y es peso atribuido a la posición.


x es posición.

7
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Lo mismo ocurre con el coeficiente de dispersión:

c (i 1)
(n 1)
Coeficiente de dispersión e

donde: e es constante base de los logaritmos neperianos.


c es valor constante.
n es longitud máxima alcanzada.
i es posición.

que equivale a la función

c (x 1)
(n 1)
y e

donde y es peso atribuido a la posición.


x es posición.
n es longitud máxima alcanzada.

Lo novedoso de este coeficiente reside en la introducción de “n”. La máxima longitud


de lista alcanzada, “n”, es el único valor que procede de la muestra que se trabaja, el resto de
los operadores son constantes subjetivas escogidas para cumplir los postulados teóricos sobre
los que se asienta la investigación.
El modelo que se desarrolla a continuación elude las constantes numéricas fijadas a
priori y obtiene todos sus operadores de las relaciones y números que resultan del recuento y
la observación de los datos.
En un primer diseño se ponderó el valor de la posición en función del total de términos
mencionados en cada lista con la intención de promediar resultados. Esta interpretación
supuso trasladar la estimación de la disponibilidad léxica a un estadio muy personalizado, ya
que evalúa la situación de cada individuo de forma separada y relega a un segundo plano los
datos marginales aportados por las tablas de frecuencia. No opera con la frecuencia relativa de
las palabras en cada posición, sino con el tamaño de los listados en los cuales aparece.
Su origen hay que buscarlo en un sencillo razonamiento: no parece lógico otorgar
igual significación a la primera mención que evoca un individuo que enumera hasta treinta

8
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

palabras dentro de un tiempo establecido, que al término inicial de otro informante que
actualiza sólo diez. La atracción léxica que mueve a elegir una opción entre varias posibles,
tanto si es consecuencia de un acto volitivo más o menos condicionado por razones
lingüísticas y psicológicas, como si es el resultado de una mera situación de azar, debe ser
más grande cuando se dispone de treinta posibilidades que cuando se cuenta sólo con diez.
De acuerdo con esa reflexión, se procede a calcular la contingencia de una palabra
para aparecer en cada posición de un listado según el número total de términos que éste
recoge. Para su cuantificación se acude a la fórmula de Laplace

ρ Casos favorables
Casos posibles

Considerando que dos palabras no pueden ocupar el mismo espacio en una lista, el
número de casos favorables en cada posición siempre es 1. El denominador de la fracción
alcanza su valor máximo, el total de términos actualizados por el informante, en la primera
mención. A partir de aquí decrece, unidad a unidad, según progresa la relación al no admitirse
la repetición.
Un ejemplo para aclarar la evolución: sea una lista de cinco vocablos. La primera
palabra actualizada tendrá una probabilidad de aparición de 1/5, es decir, 0.20. La segunda
contempla sólo cuatro casos posibles, ya que el término mencionado no puede volver a
aparecer; su probabilidad vendrá dada por el cociente 1/4, o sea, 0.25. La tercera resultará de
1/3...
El algoritmo aplicado es

1
Disponibilidad de
de la palabra en cada lista
T ( L 1)

donde: L es posición
T es total de palabras mencionadas en la lista

El índice para el conjunto de la población pasará por sumar sus disponibilidades


parciales y promediar el resultado atendiendo al número de encuestados.
Es decir

9
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

j 1
1
j N T (L 1 )
Disponibilidad palabra
N

donde: L es posición
T es total de palabras mencionadas en la lista
N es número de informantes encuestados
j es individuo

Tabla 1

La Tabla 1 presenta la evolución de los índices asignados en listados con longitudes


comprendidas entre 1 y 15 palabras. De su observación se deduce:

1. Los valores atribuidos a cada posición constituyen una sucesión de números reales
cuyo límite es 1. El puntaje de la primera posición varía en razón inversa a la longitud
de la lista y genera otra sucesión cuyo límite es 0. A pesar de partir de un principio
teórico diferente, los números de dicha sucesión responden a una función similar a la
de otros métodos de cálculo:

1
y
x 1

10
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

2. El hecho de que los cocientes se incrementen de forma constante hasta igualar en 1 la


última posición de cada lista, se debe a que la última mención se convierte en un
suceso seguro por no disponer el sujeto de alternativa a su actualización.
3. El cálculo atribuye los indicadores más altos a las últimas posiciones y los más bajos a
las primeras, justo lo contrario de lo que se viene defendiendo. La causa es simple, a
medida que se avanza en la relación los divisores son menores, manteniéndose el
dividendo.
Véanse las gráficas:

Gráfico 1

Gráfico 2

Los dos gráficos anteriores aclaran esas cuestiones. El Gráfico 1 recoge los pesos que
corresponderían a las posiciones en listados de once, doce, trace, catorce y quince términos.

11
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El Gráfico 2, por su parte, dibuja la evolución de los valores calculados para la primera
posición de acuerdo con distintas longitudes de lista.
La constatación de las incongruencias enumeradas en los datos que resultan con los
planteamientos teóricos de partida, aconseja cambiar la perspectiva de cálculo sin abandonar
la orientación esencial de la línea de metodológica. La hipótesis explotada ahora va a ser la
siguiente:

Si se acepta que la elección de cada palabra responde a un acto volitivo mediante el cual
el hablante selecciona un término entre aquellos que conoce y considera adecuados al
contexto, puede resultar apropiado para estimar su disponibilidad igualar la fuerza de
esta elección a la que se opone a su aparición, supuesto un suceso enteramente
aleatorio.

La fuerza de oposición a la que se hace referencia puede identificarse con el concepto


de probabilidad complementaria. La probabilidad complementaria [AMÓN, J. 1982:42-43] se
deriva del tercer axioma del cálculo de probabilidades, “la probabilidad de unión de dos
sucesos, „S1‟ y „S2‟, mutuamente exclusivos, es la suma de sus probabilidades”:

[
]Axioma 3

P(S1 S2) P( S1) P(S2) Si S1 S2 φ

A partir de [Axioma 3] se deduce que

Probabilidad Complementaria Suceso (A) 1 ρ Suceso (A)

donde  suceso (A) es probabilidad del suceso (A)

Si la disponibilidad de la palabra en la lista se había contemplado como la aplicación


del teorema de la propiedad complementaría daría

1
Disponibilidad de la palabra en cada lista
T (L 1)

12
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

donde: L es posición
T total de palabras mencionadas en la lista

Sin embargo, del nuevo enfoque tampoco se siguen resultados satisfactorios. Se


progresa en algún aspecto, pero hay retroceso en otros. Véase la Tabla 2 que contiene los
coeficientes calculados por este procedimiento para listas de hasta quince términos.

Tabla 1

Su lectura evidencia que:

 Se obtienen puntajes decrecientes desde la primera a la última posición.


 Los coeficientes atribuidos a la posición 1, se incrementan de acuerdo con el número
de palabras que conoce el informante.
 Se igualan en 0 todas las longitudes en la última posición.

Se avanza en las situaciones 1 y 2, que se ajustan a los presupuestos de la investigación,


pero parece improcedente asumir el 0 como coeficiente atribuible a la última palabra de la
relación porque significa, de hecho, una pérdida de información criticada en otros
métodos.
Los gráficos que siguen ayudan a visualizar lo que se afirma.

13
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Gráfico 3

Gráfico 4

14
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Gráfico 5

El Gráfico 3 demuestra que:

1. La función descrita es idéntica a la recogida el Gráfico 4, aunque ha invertido su


orientación.
2. La última posición merece la puntuación 0 y la primera muestra una tendencia hacia el
1, que, sin embargo, nunca va a alcanzar.

Los valores que corresponden a la primera posición de cada listado se pueden observar
en el Gráfico 4. Por último, si, como hace el Gráfico 5, se trazan sobre los mismos ejes los
valores alcanzados por las primeras menciones con uno y otro procedimiento, se obtiene una
figura simétrica, absolutamente previsible, que refuerza el paralelismo destacado.
El análisis que antecede demanda un cambio radical de orientación en la vía de
investigación descrita, ya que no parece conducir hasta los objetivos perseguidos. Las
incongruencias en los resultados y en el método de cálculo que, en la práctica, responde al
mismo modelo de función que se desea sustituir, con la importante diferencia de no contener
constantes subjetivas, así lo aconsejan.
Obsérvese, en la Tabla 2, la secuencia de los números que ponderan las posiciones y
que es consecuente con el paradigma matemático construido. La probabilidad de ocurrencia
de la tercera posición, por ejemplo, en una lista de diez términos, es la misma que se calcula
para la segunda posición de una relación de nueve, lo cual no guarda la suficiente coherencia
con la realidad que retrata. Si el acto del habla deriva de leyes no radicalmente estrictas y está

15
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

sometido, además, a influjos puntuales del entorno espacio-temporal y de condicionantes


psicológicos personales, no puede responder a un patrón tan regular.
Para reconducir la situación, se mira de nuevo hacia el dato longitud de lista. Ya se
justificó su incorporación a la fórmula por el reconocimiento de una mayor disponibilidad
para las primeras menciones de los listados más largos, lo que derivó en un estudio
individualizado de las encuestas para promediar luego resultados. Pero, actuando de ese
modo, no se evalúa realmente la incidencia del léxico conocido en la disponibilidad. Lo
verdaderamente importante es cuantificar la significación de ese detalle en el conjunto de la
muestra. Sólo conocer cuántos encuestados logran alcanzar una determinada posición dará
cuenta de su exacto valor. Para trabajar esta vía se retoma clásica tabla de frecuencias y se
acude al concepto de probabilidad condicional.
Se denomina probabilidad condicional o condicionada de “A” supuesto “B”, a la
probabilidad de que coincidan ambas ocurrencias en el suceso, o lo que es igual, la
probabilidad de que un segundo evento “A” se presente, si un primer evento “B” ya ha
sucedido [QUESADA PALOMA, ISIDORO MARTÍN y LÓPEZ MARTÍN. 1982:137]. Se obtiene de

Probabilidad (B/A) Probabilidad (A B)


Probabilidad A

La probabilidad condicional referida al objeto de este estudio podría expresarse como


la medida de probabilidad que tiene una palabra, conocida en una comunidad, para ser
actualizada por uno de sus miembros en una posición determinada de la lista.
Este planteamiento introduce elementos no tomados en cuenta hasta ahora, el número
de vocablos diferentes recogidos en la muestra, y la posibilidad de contemplar la información
disponible desde una óptica bayesiana.
El Teorema de Bayes, es un enunciado deductivo que define y relaciona tres
conceptos, la probabilidad a priori, la verosimilitud y la probabilidad a posteriori,
concluyendo en un algoritmo matemático conocido como fórmula de Bayes1, [BAYES, T. 1908].

1
Thomas Bayes, pastor de la iglesia presbiteriana, fue el primero en utilizar inductivamente la probabilidad.
Llegó a ser miembro de la Royal Society en 1742 a pesar de no haber publicado, en esa fecha, ningún trabajo
matemático. Después de su muerte su amigo Richard Price envió a dicha sociedad un trabajo que encontró entre
sus documentos privados para su publicación. Es el origen de la probabilidad denominada bayesiana. Se puede
profundizar esta rama de la Estadística en BERNARDO J.M. [1996; 2000], DALE, A. [1991], NIETO DE
ALBA, U. [1978], PHILIPS, L. [1993]...

16
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Su objeto es ajustar al máximo el calculo de la posibilidad de ocurrencia de un suceso,


probabilidad a posteriori, partiendo de su probabilidad teórica, o probabilidad a priori, y
conocidos los resultados habidos en experiencias anteriores similares, verosimilitud. Quesada
Paloma [QUESADA, ISIDORO y LÓPEZ. 1982:141-142] la transcribe así:

Prob. (Aj) Prob. ( B / Aj)


Probabilidad ( Aj / B)
n
Prob. (Ai) Prob. ( B / Ai)
i 1

Un ejemplo sencillo puede aclarar el razonamiento y el método de cálculo:

Se pretende estimar la probabilidad para que un alumno escoja una expresión entre
cuatro propuestas (“a”, “b”, “c”, “d”) como la más adecuada para expresar un sentimiento.
En experiencias anteriores dos alumnos de ocho optaron por la frase “a”, tres de nueve
por “b”, cuatro de doce por “c” y solo uno de diez eligió “d”.

En el problema, supuesto que las expresiones tengan la misma posibilidad de ser


seleccionadas, la probabilidad a priori es, en todos los casos, 1/4. Las experiencias anteriores
atribuyen unas verosimilitudes de 2/8 para “a”, 3/9 para “b”, 4/12 para “c” y 1/10 para “d”. La
probabilidad final se consigue mediante una tabla de cálculo similar a la Tabla 3. [AMÓN, J.

1982:53-60]. El procedimiento otorga, gracias a la información procedente de experiencias


acumuladas (verosimilitudes), un abanico de posibilidades que oscila entre tres centésimas y
setenta y seis centésimas. Nótese que la presunción primera, a priori, esperaba un valor, igual
para todas las opciones, estimado en veinticinco centésimas.

Tabla 3
Prob. a priori Verosímil. Prob. A priori * Veros. Prob. A post.

a 1/4 2/8 2/32 = 0.625 0.625/0.816 = 0.766

b 1/4 3/9 3/36 = 0.083 0.083/0.816 = 0.102

c 1/4 4/12 4/48 = 0.083 0.083/0.816 = 0.102

d 1/4 1/10 1/40 = 0.025 0.025/0.816 = 0.030

Suma = 0.816 Suma = 1.0002

2
Nótese que la suma de todas las probabilidades a posteriori es igual a 1 como establece el axioma 1 de la
probabilidad.

17
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Buscar por un método bayesiano los coeficientes de disponibilidad léxica requiere


contabilizar el total de términos distintos a disposición de la muestra. Esta necesidad nace del
cociente que calcula la probabilidad a priori de cada palabra conocida en la comunidad de
habla para ser elegida por uno de sus miembros, supuesto que:

1. El fenómeno sea puramente aleatorio.


2. Todos los informantes tengan posibilidad de acceder al uso de cualquier término
conocido por el colectivo al que pertenecen.

Admitido esto, la probabilidad a priori de hallaría así:

1
Prob . a priori
palabra a , b , c . ..
n
p

donde np es número de palabras diferentes aparecidas.

La matización de lo probable y contingente, probabilidad a priori, mediante lo


intencionado y facultativo, verosimilitud, resultará del recuento de las frecuencias relativas de
cada término.

Es decir:

Fm
Verosimilitudpalabra m
T

donde T es número total de palabras actualizadas en el conjunto de la muestra.


Fm es frecuencia final de cualquier palabra: m.

Véase otro ejemplo recogido en la Tabla 4. Se supone un colectivo constituido por 56


informantes que alcanzan una longitud de lista máxima (rango) de 10 menciones y conocen
hasta 11 términos diferentes (“a”, “b”, “c”,..., “k”) cuyas frecuencias aparecen en la columna
del margen derecho.

18
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 2

La probabilidad teórica, a priori, de elección de cada una de las palabras, dado que np
es igual a 11, será:

Probabilidadpriori 1 0.091
11

La probabilidad efectiva, verosimilitud, vendrá del cociente establecido entre cada


frecuencia y el total de menciones recogidas. En este caso el denominador T toma el valor de
466. Por lo tanto:

Frecuenciapalabra
Vesosimilitudpalabra
466

La probabilidad a posterior se alcanza en la Tabla 5.


Tabla 5

19
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

La columna producto recoge el resultado de:

1 Frecuencia
palabra m
Prob . a priori Vesosimilitud
palabra m palabra m
n T
p

donde np es número de palabras diferentes aparecidas.


T es número total de palabras actualizadas en el conjunto de la muestra

En el supuesto:

1 Frecuenciapalabra m Frecuenciapalabra m
Productom
11 466 5126

La última columna de la tabla de cálculo3 , que concluye la tendencia de aparición de


cada entrada ponderada desde el punto de vista de la probabilidad (dentro del intervalo
comprendido entre 0 y 1), responde a la fórmula:

Fm
np T
Prob . a posteriori palabra m
m n Fm
m 1 np T

donde np es número de palabras diferentes aparecidas.


T es número total de palabras actualizadas en el conjunto de la muestra
Fm es frecuencia final de la palabra.

Si se extrae el factor común y se simplifica, queda

Fm
np T Fm
Prob. a posteriori palabra
m
m n T
1
Fm
( np T ) m 1

donde T es número total de palabras actualizadas en el conjunto de la muestra

3
Nótese que la probabilidad a posteriori obtenida coincide con la verosimilitud, lo cual facilita notablemente el
trabajo futuro. Esto era esperable porque el supuesto contempla la misma probabilidad teórica para cada entrada.

20
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Fm es frecuencia final de la palabra.

Hasta el momento no se ha tomado en consideración el elemento posición. Para


hacerlo conviene recordar que se quiere:

1. Buscar, dentro del sistema, una alternativa a los modelos exponenciales que usan
constantes sugeridas de acuerdo con un entramado de condiciones ajenas a los datos,
por otro que opere “con”, y “a partir de”, la información generada dentro de la propia
muestra.
2. Rechazar la puntuación uniforme que define igual peso a la misma posición. No
parece coherente premiar con significación semejante una “cuarta posición” aparecida
dentro de un colectivo que raramente alcanza el lugar doce, y otra “cuarta posición”
producida en una comunidad donde habitualmente se llega al puesto veinticinco.

En armonía con esa doble perspectiva, aquí se propone ponderar la posición con dos
variables: el número de informantes que la logran y el total de menciones generadas hasta
cubrirla. Para desarrollar esta idea considérese de nuevo de la tabla de frecuencias Tabla 6. La
última fila recoge el total de encuestados que completan las posiciones: todos, es decir,
cincuenta y seis, cumplimentan la primera, cincuenta y cinco la segunda,... y sólo treinta y
seis llegan a la décima. Tabla 6

Luego, se puede afirmar que:

21
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

 Cincuenta y seis informantes, de cincuenta y seis posibles, alcanzan la “posición uno”;


cincuenta y cinco personas de las cincuenta y seis encuestadas, la “posición dos”;
cincuenta y dos de cincuenta y seis, la “posición tres”...
 Las primeras cincuenta y seis palabras emitidas por los informantes, ocupan
necesariamente la “posición uno”; las siguientes cincuenta y cinco palabras, de las
ciento once emitidas, la “posición dos”; cincuenta y dos de ciento sesenta y seis
actualizaciones, “la posición tres”...

Hay una primera fila adicional, “términos hasta la posición”, que cuenta las menciones
habidas hasta cubrir cada referencia (56 términos recoge la “posición 1”, 111 se computan
hasta completar la “posición 2”, 163 integran la “posición 3”...). Con su auxilio se estima la
“probabilidad de la columna”: cincuenta y seis de cincuenta y seis (56/56); cincuenta y cinco
de ciento once (55/111); cincuenta y dos de ciento sesenta y tres (52/163)...
De un cociente similar resulta la “probabilidad de la palabra en la columna”. Esto es,
una palabra de cincuenta y seis posibles (1/56); una palabra de ciento once posibles (1/111);
una palabra de ciento sesenta y tres posibles (1/163)... Se antepone, además, una columna que
recoge las probabilidades a posteriori de cada término que se calcularon en la Tabla 6. Se
dispone, por tanto, de información referida a la población de la que procede la muestra,
relativa a:

 Medida de la tendencia de cada palabra para ser mencionada en la encuesta


(probabilidad a posteriori).
 Medida de la probabilidad de cada palabra para aparecer en todas y cada una de las
posiciones de las listas. Este indicador se ha trasladado a la Tabla 7.

Tabla 7

22
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Los números contenidos en cada celda responden al cociente


Frecuencia de la palabra en la posición
Total de términos hasta la posición

Se va a contar ahora con dos medidas de probabilidad, una a priori y otra


condicionada, que facilitan el recurso al teorema del producto o probabilidad compuesta y,
consecuentemente, conocer la posibilidad que tiene una palabra para ser elegida por un
informante, y serlo en una determinada posición
La probabilidad compuesta, o regla de multiplicación de probabilidades, se deriva de
la probabilidad condicionada. Contempla la ocurrencia simultánea de dos sucesos (suceso
intersección de “A” y “B”). Es igual a la probabilidad a priori del suceso “A”, multiplicada
por la probabilidad del suceso “B” condicionada al cumplimiento del suceso “A” [AMÓN, J.

1982:47-48], es decir:

Probabilidad (A B) Probabilidad (A) Probabilidad (B/A)

La probabilidad del vocablo “m” para ser actualizado y mencionado en primera


posición, P(m) en (L1) quedará determinada mediante el producto de dos tendencias, la
probabilidad de elección de la palabra “m” y la probabilidad de aparición de la palabra “m” en
el lugar “L1".
Se concreta en la expresión:

P ( m ) en ( L ) Pm PL
1 1/ m

donde P es probabilidad
Pm es probabilidad de la palabra m
P L1/m es lugar probabilidad condicional de m respecto a L1

23
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Si se busca un indicador ρ capaz de resumir en un número la suma de las


posibilidades que una palabra, “m”, tiene de ser actualizada en cualquier posición de las listas,
su cálculo responderá a

x n
ρm P m
P (L x / m )
x 1

donde Pm es probabilidad a priori de la palabra m


Lx es lugar
P(Lx / m) es probabilidad de la palabra m en la posición Lx

La Tabla 8 contempla en su columna final la suma perseguida.

Tabla 8

No obstante, los resultados alcanzados precisan corrección porque la suma de las


probabilidades calculadas no es igual a la unidad (el suceso seguro siempre debe ser 1). Se
puede acudir de nuevo a la probabilidad condicional P (Lx / m).

Frecuencia de m en L x F(m /Lx)


P (L X/m)
Total de términos hasta Lx tL x

donde Lx es lugar
F(m/Lx) es frecuencia de m en posición Lx
tLx es total de entradas hasta la posición Lx

24
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

La probabilidad a priori de “m” era

Frecuencia de m Fm
Probabilidad a priorim
Total de palabras recogidas T

donde Fm es frecuencia final de m


T es total de entradas recogidas

Por lo tanto se puede rescribir la fórmula del modo siguiente:

F x n F
m m /L x
ρm
T x 1 tLx

donde T es número total de entradas recogidas


Fm es frecuencia final de la palabra m.
Fm/Lx es frecuencia de la palabra m en la posición x.
tLx es total de entradas hasta la posición Lx.

El análisis del algoritmo de cálculo demuestra que

1. El primer factor del producto responde a la probabilidad teórica de aparición de la


palabra “m”, es decir, a su probabilidad a priori.
2. El segundo factor contempla la suma de las probabilidades de ocurrencia de la palabra
“m” en determinadas condiciones, en este caso, que “m” ocupe una posición concreta.
En definitiva representa una suma de verosimilitudes.

Se trata, en definitiva, del producto de probabilidades a priori de la palabra “m” por


una sucesión de verosimilitudes. Se puede acudir, de nuevo, al Teorema de Bayes y dividir
cada celda de la columna “total” de la Tabla 8 entre la suma de todos los valores que
contiene, como se hace en la Tabla 9. Se obtiene una medida ponderada (columna
“probabilidad a posteriori”), en un rango entre cero y uno, cuya suma es igual a la unidad
según exige la condición probabilística.

25
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 9

Este número es el que se ofrece como índice de disponibilidad léxica. Su notación


matemática podría ser

Fm x n F
m /Lx
T x 1 t Lx
Disponibilidad Palabra m
m n Fm x n F
m /Lx

m 1 T x 1 t Lx

donde: T es número total de entradas actualizadas


Fm es frecuencia final de la palabra m.
FmLx es frecuencia de la palabra m en la posición Lx.
tLx es total de entradas hasta la posición x.

Es, en definitiva, un cociente cuyo numerador contempla el producto de dos factores

Fm Frecuencia de la palabra
es
T Total de entradas

x n F
m /L Frecuencia de m en cada posición
x
es suma de cocientes
x 1 tL Total de entradas hasta esa posición
x

El denominador, por su parte, recoge la suma de los productos correspondientes a


todos los vocablos admitidos.

26
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El método parece satisfacer las cláusulas exigidas para validarlo como procedimiento
alternativo. Sus rasgos definitorios son

 Opera con valores referidos a


o Número total de actualizaciones aceptadas (T).
o Frecuencia de cada término o entrada admitida como válida (F).
o Frecuencia de la palabra en cada posición (Fm/Lx).
o Total de palabras recogidas hasta cubrir cada posición (tLx).
 No existen constantes ni referencias generadas fuera de la propia muestra.
 Los pesos asignados al conjunto de primeras menciones suman 1.
 Las posiciones son matizadas por un elemento ponderador que decrece de forma
variable de acuerdo con la importancia relativa de cada lugar en la totalidad de la
encuesta.

Un ejemplo de esa evolución se aprecia en la Tabla 10. Nótese que el total de


menciones es constante en los tres casos.

Tabla 10

Para conocer exactamente como han operado los mecanismos de cálculo y


ponderación sobre las variables, se han hallado los coeficientes de correlación que resultan de
cruzar las frecuencias de las palabras en las posiciones con los índices de disponibilidad que
se consiguen por este procedimiento. La información se encuentra en la Tabla 11 y permite
extraer algunas conclusiones:

27
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 11

1. El elemento con mayor presencia en la puntuación última alcanzada es, y no podía ser
de otro modo, la frecuencia final (F) que alcanza una correlación de 0.94.
2. La trascendencia de la posición varía radicalmente de las primeras a las últimas. La
oscilación se encuentra dentro del rango comprendido entre + 0.89 y - 0.19.

En la que sigue, Tabla 12, se comparan las relaciones ordenadas de vocablos que
derivan de aplicar los criterios frecuencia de aparición y disponibilidad léxica.
Se comprueba aquí que la incidencia del lugar en que aparece la mención es más
significativa en las frecuencias medias, lo cual era previsible a la vista de los coeficientes de
correlación estimados. Se demostrará posteriormente que la variación crece en razón directa al
total de vocablos emitidos por la muestra, esto es, a la variable T.

Tabla 12

28
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Todo el proceso reflexivo desarrollado hasta ahora se ha apoyado sobre datos teóricos.
A continuación se exponen los resultados que se alcanzan cuando se ensaya el método sobre
una muestra representativa y estadísticamente fiable.
Se trabaja con la encuesta realizada a mil quinientos quince alumnos de Almería, con
edades comprendidas entre los nueve y los doce años, referida al centro de interés 01, “Las
partes del cuerpo”. Se resume en la Tabla 13.
El total de menciones recogidas asciende a veintidós mil ciento dieciocho.
El número de entradas diferentes, después de unificar vocablos, es de trescientos
cuarenta y cinco.
Los números en detalle son, por tanto:

• Informantes: 1 515
• nP: 345
• T: 22 118
• Correlación disponibilidad - frecuencia: 0.883789

Tabla 13

29
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Esta Tabla evidencia dos realidades:

1. La ponderación del factor posición con listas entre una y treinta palabras, se
mueve dentro del rango 1 - 0.00005.
2. La correlación calculada para la par disponibilidad - frecuencia en la posición,
tiene las oscilaciones consecuentes con los pesos que la propia muestra otorga.
La tendencia se dibuja en el Gráfico 6.

Permítase, antes de analizar este dibujo, un breve comentario acerca de los


coeficientes de correlación. Cuando dos fenómenos sociales, físicos o biológicos, crecen o
decrecen de forma simultánea y proporcional debido a factores externos, se dice que están
positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los
dos fenómenos están negativamente correlacionados.
Una correlación positiva perfecta tiene un coeficiente + 1. Una correlación negativa
perfecta tiene un coeficiente 1. La ausencia de correlación se manifiesta en un coeficiente 0.
Por ejemplo, el coeficiente 0.89 indica una correlación positiva grande, 0.76 es una
correlación negativa grande y 0.13 es una correlación positiva pequeña.
El más usado de los coeficientes de correlación es el propuesto por Karl Pearson. Su
índice está pensado para cuantificar esta medida cuando la variación es lineal.
Se denomina correlación lineal, aquella cuya representación gráfica presenta una nube
de puntos próxima a una línea recta. Se obtiene dividiendo la covarianza entre el producto de
las desviaciones estándar de ambas variables.
Pero no siempre la relación entre las variables se ajusta a este modelo. En esos casos el
coeficiente Pearson no es apropiado por lo que conviene utilizar otros indicadores [RÍUS;

BARÓN; SÁNCHEZ y PARRAS. 1995].

Si se calcula el coeficiente Pearson para las variables disponibilidad y frecuencia en la


experiencia recogida en la Tabla 13, se estima en 0.88. Es un indicador alto, que dice mucho
de la importancia de la frecuencia, pero claramente inferior a los que resultan de tratar la
misma muestra con los procedimientos de López Chávez y Strassburger o López Morales y
Lorán (λ = 0.9). En estos casos se mueve alrededor del 0.95.
Ello es un síntoma claro del mayor peso específico que, en la estrategia de cálculo de
la disponibilidad que aquí se propone, se concede al factor posición.

30
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

El análisis de la misma correlación, pero referida a las frecuencias habidas en cada


lugar de las listas, confirma que el modelo comparte con los anteriormente la misma
tendencia general, pero es mucho más sensible a las variaciones y circunstancias de los datos.

Gráfico 6

Obsérvese, con esta intención, en el Gráfico 6, la aparente disfunción que significa el


coeficiente calculado para la “posición 29”.
La explicación es simple. El “lugar 29" es alcanzado por un solo informante que
actualiza allí la palabra “mano”. El término es el tercero más disponible del conjunto
ordenado según disponibilidad y el sexto atendiendo a la frecuencia absoluta. Cabe, por tanto,
aventurar que lo anormal y anecdótico es su aparición en un lugar tan atrasado y que
corresponde a un caso extremo y poco significativo. Por eso el índice de correlación está muy
por encima del que le correspondería sólo por posición.
Otro aspecto interesante es la evolución del agente multiplicador que pondera la
significación de la posición.
La Tabla 14 y el Gráfico 7, que siguen, recogen este detalle. La cifra resaltada en
negrita corresponde al coeficiente compensador que, multiplicado por la frecuencia, cuantifica
la posición.

31
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Tabla 14

Gráfico 7

32
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Recuérdese que no es más que una medida de probabilidad que depende del número de
actualizaciones que aparecen en la posición y del total de menciones habidas hasta cubrir la
posición en cuestión (véase Tabla 10).
En páginas siguientes se reproducen fragmentos de la Tabla de Frecuencias de la
encuesta mencionada y de los índices de disponibilidad léxica alcanzados.
Se incluyen dos relaciones con los términos aparecidos. La primera presenta las
palabras ordenadas de mayor a menor disponibilidad y la segunda sigue un criterio alfabético
para facilitar consultas concretas.

33
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Pantalla de TABLA DE FRECUENCIAS

Fragmento de la resultante en el estudio de los coeficientes de disponibilidad léxica de


términos relacionados con el “cuerpo humano”, en niños con edades comprendidas entre
los nueve y los doce años de la ciudad de Almería.
Producida por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para alcanzar los
coeficientes de disponibilidad léxica.

34
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Fragmento de listado alfabetizado de coeficientes de disponibilidad léxica de términos


relacionados con el “cuerpo humano”, en niños con edades comprendidas entre los
nueve y los doce años de la ciudad de Almería, según la fórmula aquí defendida.
Producido por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para
alcanzar los coeficientes de disponibilidad léxica.

35
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Reproducción del listado completo de coeficientes de disponibilidad léxica atribuidos a


los términos relacionados con el “cuerpo humano”, en niños con edades comprendidas
entre los nueve y los doce años de la ciudad de Almería, según la fórmula aquí
defendida.
Producido por la aplicación DLEXUAL (Hojas de cálculo relacionadas) elaborada por este autor para
alcanzar los coeficientes de disponibilidad léxica.

CENTRO DE INTERÉS - 01 - LAS PARTES DEL CUERPO


Coeficientes de Disponibilidad Léxica de términos aparecidos en la encuesta.
Ordenación decreciente de índices

Frecuencia Disponibilidad Palabra Nº de Orden


800 0,130790786 Cabeza 1
985 0,115147647 Ojo 2
786 0,075934396 Mano 3
874 0,069436876 Nariz 4
786 0,065771647 Pierna 5
717 0,064635222 Brazo 6
651 0,058445556 Corazón 7
816 0,057042245 Boca 8
731 0,048770972 Pie 9
758 0,046417482 Oreja 10
764 0,036741519 Dedo 11
439 0,028447394 Hueso 12
510 0,026380663 Pulmón 13
419 0,021391526 Cerebro 14
433 0,014146016 Pelo 15
421 0,011666149 Rodilla 16
275 0,009475968 Músculo 17
331 0,009010618 Estómago 18
293 0,008324671 Hígado 19
368 0,006233611 Uña 20
317 0,005843407 Diente 21
303 0,005608573 Codo 22
275 0,005336801 Cuello 23
202 0,005112428 Fémur 24
246 0,005026659 Costilla 25
180 0,004693109 Cráneo 26
221 0,004381850 Radio 27
246 0,003460807 Lengua 28
222 0,003376755 Vena 29
200 0,003308423 Pene 30
214 0,002878485 Hombro 31
151 0,002625616 Cara 32
155 0,002267421 Riñón 33
194 0,002178753 Tobillo 34
152 0,002172970 Tibia 35
172 0,002096382 Columna vertebral 36
195 0,002053930 Muñeca 37

36
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


154 0,002016534 Peroné 38
134 0,001766740 Tronco 39
152 0,001739468 Intestino 40
175 0,001631483 Barriga 41
147 0,001597513 Gemelo 42
161 0,001428975 Ceja 43
127 0,001319718 Cúbito 44
156 0,001265359 Muslo 45
137 0,000966596 Pecho 46
142 0,000953660 Espalda 47
111 0,000895225 Esófago 48
113 0,000879284 Bíceps 49
112 0,000815810 Ombligo 50
106 0,000794209 Faringe 51
113 0,000793963 Oído 52
96 0,000712495 Arteria 53
106 0,000709533 Sangre 54
114 0,000686377 Culo 55
78 0,000660185 Húmero 56
111 0,000573239 Pestaña 57
84 0,000509174 Ano 58
65 0,000489733 Tórax 59
82 0,000471272 Laringe 60
83 0,000465235 Intestino grueso 61
83 0,000459584 Intestino delgado 62
64 0,000449185 Extremidad 63
72 0,000427581 Omóplato 64
91 0,000402085 Labio 65
75 0,000390762 Páncreas 66
61 0,000388406 Rótula 67
83 0,000381662 Cadera 68
56 0,000366350 Clavícula 69
81 0,000334103 Vagina 70
43 0,000287950 Esqueleto 71
61 0,000286823 Tráquea 72
58 0,000286141 Vulva 73
62 0,000281390 Testículo 74
67 0,000270857 Piel 75
64 0,000264044 Glúteo 76
54 0,000250680 Cerebelo 77
50 0,000199704 Esternón 78
46 0,000181448 Bronquio 79
29 0,000180382 Órgano 80
47 0,000165131 Abdomen 81
46 0,000159102 Mandíbula 82
51 0,000146719 Garganta 83
43 0,000144793 Pelvis 84
45 0,000141101 Tríceps 85
41 0,000134862 Carne 86
40 0,000125555 Tímpano 87
37 0,000122706 Esternocleidomastoideo 88
38 0,000120201 Tripa 89
39 0,000098344 Vejiga 90
36 0,000093816 Tendón 91
38 0,000092741 Antebrazo 92
42 0,000085614 Cintura 93

37
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


43 0,000083876 Teta 94
31 0,000073320 Vértebra 95
42 0,000072824 Frente 96
37 0,000069026 Pupila 97
35 0,000067251 Nervio 98
24 0,000059852 Cuerpo 99
26 0,000059589 Célula 100
27 0,000057481 Frontal 101
29 0,000049962 Ovario 102
23 0,000042079 Útero 103
24 0,000040640 Trapecio 104
26 0,000032552 Cuádriceps 105
25 0,000031395 Iris 106
29 0,000030117 Talón 107
20 0,000025433 Capilar 108
16 0,000024047 Encéfalo 109
22 0,000021705 Nuca 110
20 0,000021116 Uretra 111
14 0,000020332 Mama 112
21 0,000019937 Articulación 113
16 0,000019315 Bulbo raquídeo 114
17 0,000018517 Caja torácica 115
15 0,000017873 Fosa nasal 116
21 0,000017019 Ingle 117
12 0,000015741 Aparato digestivo 118
19 0,000015670 Barbilla 119
15 0,000015094 Pómulo 120
12 0,000015090 Deltoides 121
13 0,000013159 Tarso 122
11 0,000013131 Aparato excretor 123
19 0,000012793 Nudillo 124
15 0,000012714 Caracol 125
18 0,000012614 Moflete 126
15 0,000012464 Alveolo 127
18 0,000011884 Sobaco 128
13 0,000011733 Bronquiolo 129
12 0,000011720 Coxis 130
15 0,000011167 Parietal 131
10 0,000010323 Vesícula 132
11 0,000010024 Diafragma 133
15 0,000009931 Falange 134
10 0,000009447 Nasal 135
15 0,000009281 Uréter 136
13 0,000008935 Trasero 137
8 0,000008320 Bazo 138
11 0,000007982 Aparato respiratorio 139
13 0,000007885 Carpo 140
14 0,000007862 Metatarso 141
14 0,000006910 Muela 142
9 0,000006686 Escroto 143
13 0,000006437 Párpado 144
11 0,000006287 Vista 145
10 0,000006189 Espermatozoide 146
12 0,000005992 Pectoral 147
12 0,000005846 Espinilla 148
8 0,000005792 Bilis 149

38
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


8 0,000005780 Aparato reproductor 150
9 0,000005694 Óvulo 151
9 0,000005613 Apéndice 152
11 0,000005454 Mejilla 153
10 0,000005081 Colon 154
9 0,000004856 Píloro 155
11 0,000004780 Planta del pie 156
11 0,000004719 Metacarpo 157
10 0,000004509 Occipital 158
10 0,000004223 Encía 159
6 0,000003972 Ventrículo 160
6 0,000003956 Cabello 161
10 0,000003893 Abdominal 162
9 0,000003823 Cuerda vocal 163
9 0,000003541 Recto 164
5 0,000003465 Matriz 165
9 0,000003415 Tacto 166
9 0,000003396 Sexo 167
8 0,000003391 Glándula salival 168
8 0,000003342 Maxilar superior 169
9 0,000003227 Seno 170
7 0,000003108 Trompa de Falopio 171
8 0,000003030 Axila 172
7 0,000003023 Médula espinal 173
9 0,000002744 Papila gustativa 174
7 0,000002726 Maxilar inferior 175
6 0,000002695 Aparato circulatorio 176
6 0,000002587 Plaqueta 177
6 0,000002513 Cartílago 178
8 0,000002502 Maxilar 179
6 0,000002483 Chocho 180
7 0,000002483 Vello 181
7 0,000002390 Temporal 182
7 0,000002381 Pubis 183
6 0,000002336 Meñique 184
7 0,000002303 Pompi 185
4 0,000002230 Pituitaria 186
8 0,000002192 Saliva 187
6 0,000002185 Ligamento 188
7 0,000002129 Olfato 189
6 0,000001932 Retina 190
7 0,000001924 Nalga 191
7 0,000001858 Cristalino 192
6 0,000001842 Glóbulo blanco 193
6 0,000001832 Glóbulo rojo 194
6 0,000001831 Picha 195
5 0,000001797 Pellejo 196
5 0,000001783 Glándula 197
5 0,000001684 Masetero 198
5 0,000001654 Jugo gástrico 199
5 0,000001542 Sentidos 200
6 0,000001486 Pezón 201
6 0,000001471 Glándula sudorípara 202
6 0,000001467 Íleon 203
6 0,000001458 Campanilla 204
6 0,000001442 Yema 205

39
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


3 0,000001440 Molar 206
5 0,000001238 Gusto 207
5 0,000001173 Vaso sanguíneo 208
5 0,000001123 Trapezoide 209
5 0,000001122 Pantorrilla 210
5 0,000001075 Médula 211
3 0,000001052 Médula ósea 212
4 0,000000937 Huevos 213
4 0,000000930 Grasa 214
5 0,000000917 Vena Cava 215
4 0,000000899 Epiglotis 216
4 0,000000823 Glóbulo 217
3 0,000000812 Esclerótica 218
4 0,000000807 Grano 219
4 0,000000771 Cardias 220
4 0,000000667 Colmillo 221
4 0,000000653 Duodeno 222
4 0,000000627 Barba 223
4 0,000000616 Nuez 224
4 0,000000606 Poro 225
4 0,000000600 Paladar 226
4 0,000000599 Dorsal 227
3 0,000000579 Sesos 228
4 0,000000577 Quimo 229
4 0,000000564 Dermis 230
3 0,000000507 Jugo pancreático 231
3 0,000000501 Martillo 232
3 0,000000488 Pabellón auditivo 233
3 0,000000479 Vena Aorta 234
3 0,000000467 Aparato 235
2 0,000000460 Sudor 236
3 0,000000457 Tabique nasal 237
3 0,000000446 Dedo corazón 238
3 0,000000434 Pito 239
3 0,000000405 Espina dorsal 240
1 0,000000403 Válvula 241
1 0,000000403 Tiroides 242
2 0,000000388 Clítoris 243
3 0,000000382 Orina 244
3 0,000000382 Pulgar 245
3 0,000000380 Mandíbula superior 246
3 0,000000379 Cadena de huesecillos 247
2 0,000000366 Labio mayor 248
3 0,000000352 Mandíbula inferior 249
3 0,000000346 Bigote 250
3 0,000000304 Dentadura 251
2 0,000000300 Cervical 252
3 0,000000298 Quilo 253
2 0,000000289 Nervio óptico 254
3 0,000000284 Peca 255
3 0,000000281 Aurícula 256
3 0,000000276 Tendón de Aquiles 257
2 0,000000268 Tejido 258
2 0,000000237 Mucosa 259
2 0,000000237 Orificio nasal 260
2 0,000000223 Aparato urinario 261

40
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


2 0,000000207 Sartorio 262
1 0,000000202 Asadura 263
1 0,000000202 Tejido muscular 264
2 0,000000198 Córnea 265
2 0,000000194 Genital 266
2 0,000000194 Índice 267
2 0,000000191 Ciego 268
2 0,000000179 Lunar 269
2 0,000000177 Yeyuno 270
2 0,000000176 Vía respiratoria 271
2 0,000000166 Vena Pulmonar 272
2 0,000000160 Tubo digestivo 273
2 0,000000160 Membrana 274
2 0,000000147 Vesícula seminal 275
2 0,000000144 Premolar 276
2 0,000000144 Paleta 277
2 0,000000139 Aparato locomotor 278
2 0,000000137 Yunque 279
1 0,000000135 Glándula suprarrenal 280
1 0,000000135 Hormona 281
1 0,000000135 Órgano reproductor 282
2 0,000000134 Vientre 283
2 0,000000128 Puño 284
2 0,000000127 Bolo alimenticio 285
2 0,000000126 Arruga 286
2 0,000000120 Calva 287
1 0,000000102 Labio menor 288
1 0,000000102 Laberinto 289
1 0,000000102 Palma 290
1 0,000000102 Alma 291
1 0,000000082 Falangina 292
1 0,000000082 Coco 293
1 0,000000082 Verga 294
1 0,000000082 Espíritu 295
1 0,000000082 Mancha de nacimiento 296
1 0,000000068 Falangeta 297
1 0,000000068 Tuétano 298
1 0,000000068 Órgano visual 299
1 0,000000059 Polla 300
1 0,000000059 Fontanela 301
1 0,000000052 Ubre 302
1 0,000000052 Ganglio 303
1 0,000000052 Chumino 304
1 0,000000047 Aparato femenino 305
1 0,000000047 Cintura pelviana 306
1 0,000000047 Feto 307
1 0,000000047 Morrillo 308
1 0,000000047 Gusanillo 309
1 0,000000043 Cintura escapular 310
1 0,000000043 Aparato masculino 311
1 0,000000043 Toto 312
1 0,000000040 Meninge 313
1 0,000000040 ADN 314
1 0,000000040 Nervio auditivo 315
1 0,000000040 Cola 316
1 0,000000037 Mentón 317

41
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Frecuencia Disponibilidad Palabra Nº de Orden


1 0,000000037 Dedo gordo 318
1 0,000000037 Boca del estómago 319
1 0,000000035 Vena Renal 320
1 0,000000035 Torso 321
1 0,000000035 Plasma 322
1 0,000000035 Coño 323
1 0,000000033 Menisco 324
1 0,000000033 Célula cerebral 325
1 0,000000032 Axón 326
1 0,000000032 Verruga 327
1 0,000000032 Heces 328
1 0,000000032 Empeine 329
1 0,000000032 Perilla 330
1 0,000000032 Sal 331
1 0,000000030 Juanete 332
1 0,000000030 Incisivo 333
1 0,000000030 Variz 334
1 0,000000030 Órgano genital 335
1 0,000000030 Pipí 336
1 0,000000029 Moco 337
1 0,000000029 Arañazo 338
1 0,000000029 Carrillo 339
1 0,000000029 Conducto nasal 340
1 0,000000029 Cutis 341
1 0,000000028 Cordón umbilical 342
1 0,000000028 Caspa 343
1 0,000000028 Isquion 344
1 0,000000028 Cuero cabelludo 345

42
ANTONIO
ANTONIO GARCÍA MEGÍA – DOCTOR EN FILOLOGÍA HISPÁNICA – ALMERÍA
Web personal: http://angarmegia.com Correo electrónico: angarmegia@angarmegia.com

Bibliografía

AMÓN, Jesús. (1982).


Estadística para psicólogos (Probabilidad y estadística inferencial). Tomo II.
Neurociencia. Editorial Pirámide. Madrid.
----, (1990). Estadística para psicólogos I. (Estadística descriptiva). Psicología, 12. Pirámide,
Madrid.
BAYES, Thomas. (1908). Versuch zur Lösung eines Problems der
Wahrscheinlichkeitsrechnung. Engelmann. Leipzig.
BUTRÓN, Gloria Izaskun. (1987). El léxico disponible: índices de disponibilidad.
Disertación presentada en la Universidad de Puerto Rico como requisito para la
obtención del grado de Doctor en Filosofía y Letras. Puerto Rico.
LAPLACE, Pierre Simón de. (1812). Théory analytique des probabilités. Courcier. París.
----, (1825). Essai philosophique sur les probabilités. Badhelier. París.
QUESADA PALOMA, V.; ISIDORO MARTÍN, A. y LÓPEZ MARTÍN, L. A. . (1982).
Curso y ejercicios de estadística. 2ª ed. Alhambra, Madrid.
RÍUS, F.; BARÓN, F. J.; SÁNCHEZ, E. y PARRAS, L. (1995). Bioestadística: métodos y
aplicaciones. SPICUM, Universidad de Málaga. Málaga.

43

Вам также может понравиться