Академический Документы
Профессиональный Документы
Культура Документы
Sonia Nina.
ICANE 2019
Este trabajo muestra un estudio estadístico acerca de la cantidad de fonemas vocálicos y
consonánticos de los idiomas más hablados y más curiosos del mundo en relación a la zona
geográfica en la que se hablan, con la intención de comprobar si está influye en el número de
fonemas de un tipo u otro en cada idioma.
Cuando comencé este curso no sospechaba que en la clase de 1º de ESO iba a encontrar a
dos alumnas con una disposición tan buena para aprender y trabajar, y con tantas ganas de
investigar y descubrir. Unas alumnas así se merecían realizar una práctica real, que les
permitiera ver una aplicación en contexto de parte de las Matemáticas que estudiarían durante
el curso.
Por último, me gustaría un objetivo más ambicioso y que la realización de este trabajo también
sirviera de ejemplo y de motivación para otros estudiantes del centro, y que en futuras
ediciones de este concurso sean muchísimos más los alumnos participantes y los trabajos
presentados.
2. Descripción del proyecto.
Este trabajo surge de una observación que nos hizo nuestra profesora de matemáticas y que
queremos comprobar si puede ser cierta: parece que cuanto más frío es un país, más
fonemas consonánticos tiene su idioma, y tal vez sea porque cierran más la garganta para no
contraer enfermedades asociadas al frío. En cambio, cuanto más calor hace en un país,
menos fonemas consonánticos, y más vocálicos, pronuncian, ya que no sienten la necesidad
de cerrar la garganta para protegerse del frío. Pensemos, por ejemplo, en cómo suenan el
alemán y el árabe. Aparentemente el alemán suena con más consonantes y el árabe con más
vocales y da la casualidad de que en Alemania hace más frío que en los países donde se
habla árabe: ¿influirá la latitud de un país en los sonidos del idioma que se habla en ese país?
Para demostrar o rechazar nuestra hipótesis vamos a comenzar recordando una serie de
aspectos relacionados con el lenguaje: Lengua es el sistema de comunicación y expresión
verbal propio de un país, nación o comunidad lingüística. Lo que es muy parecido a idioma:
la lengua de un país o una región. Los dialectos son las variedades de una lengua que se
hablan en un determinado territorio y el habla es la utilización individual de la lengua. Un
fonema es el sonido de la lengua y un grafema es la representación escrita de un sonido.
Los fonemas son laS unidades básicas del estudio fonológico de una lengua; se representa
gráficamente dentro de dos rayas oblicuas: /.../, y pueden corresponderse con varios
grafemas. Por ejemplo, el fonema /B/ es igual a <b> y a <v>, sus sonidos se denominan
alófonos y se representan entre corchetes. Tienen varias características como que son
abstractos, invisibles y carecen de significado propio.
Son varios los autores ([1]) que han tratado de estudiar cómo los condicionamientos
ambientales influyen en los sonidos de las lenguas. Estos investigadores se han centrado
principalmente en la distancia evolutiva, en la altitud y la presión atmosférica, en la humedad
y en la temperatura y la vegetación.
Distancia evolutiva.
Quentin D. Atkinson (2011) ([14]) propone que, si la diversidad genética y fenotípica humana
disminuye con la mayor distancia de África, algo parecido ocurre con el lenguaje. Para probar
esta idea analizó la cantidad de fonemas que poseen una muestra de 504 lenguas, del total
de las aproximadamente 6 700 lenguas habladas en el mundo, y los puso en relación con el
posible origen del lenguaje en África. Con esto descubrió que hay una relación entre el
número de sonidos de las lenguas y su distancia de África. Por ejemplo, la lengua Xhosa,
hablada en el sur del continente africano, cuenta con 84 fonemas, mientras que el Maorí de
Nueva Zelanda presenta sólo 20.
Humedad.
En 2015, Caleb Everett con Damian Blasi y Sean Roberts ([18]) propusieron que las lenguas
con patrones complejos de fonación en cuanto a los tonos se dan con más frecuencia en
regiones húmedas, ya que la humedad ambiental mejora la hidratación de las cuerdas
vocales. Así, por ejemplo, los seis tonos léxicos de uno de los dialectos vietnamitas, hacen
que una palabra varíe su significado en función del tono con el que se pronuncie (no es lo
mísmo “número”, que “numero”). Esto supone un elevado control de las cuerdas vocales y,
para ello, tienen que estar adecuadamente hidratadas. Su análisis se basa en el estudio 527
lenguas y en la correlación entre la distinta humedad y temperatura y las zonas donde las
lenguas habladas tienen más de tres tonos. Descubrieron que el 25% de las lenguas con
tonos complejos ocurren en zonas húmedas en el 88% de los casos, y el 50% en un 43% de
zonas húmedas.
En 2017, Everett ([17]) publicó un trabajo parecido sobre la relación entre los espacios
húmedos y secos y las vocales. Analizó 4 012 listas de palabras de distintas variedades de
familias de lenguas y relacionó las vocales y las consonantes de esas lenguas con los valores
de humedad de las zonas donde se hablaban, descubriendo que las zonas de menor
humedad se relacionan con sistemas vocálicos más pequeños. Por ejemplo, en España el
clima es predominantemente seco y el español tiene sólo cinco vocales, que es un sistema
vocálico muy sencillo.
Temperatura y vegetación.
Finalmente, Ian Maddieson y Christophe Coupé en sendos trabajos de 2015 ([19]) y 2016
([15]) sostienen la hipótesis de que los repertorios fónicos de las lenguas están relacionados
con la temperatura y la vegetación en las zonas donde se hablan. Así, a partir del análisis de
706 lenguas en el trabajo de 2015 y 684 en el de 2016 analizan esta posible correlación entre
la clasificación de los sonidos en sonantes (vocales, glides, vibrantes, laterales y nasales) y
obstruyentes (fricativas sordas, fricativas sonoras, oclusivas sonoras y oclusivas sordas) por
la que los sonidos sonantes son más audibles que los obstruyentes, dentro de una escala de
perceptibilidad continua. Con ello prueban que los sonidos más sonoros (que se caracterizan
por bajas frecuencias) se darán en zonas de lenguas con gran vegetación, ya que la presencia
de árboles dificultaría la transmisión de información. Esto parece explicar un 20% de la
distribución de los repertorios analizados.
A modo de curiosidad nos gustaría destacar el idioma !Xoon o Taa, hablado en Namibia y
Botswana, que es el que tiene mayor número de fonemas: 118, el idioma Ubykh, extinguido
en 1992 y que se hablaba en el Cáucaso, que tenía 86 (uno de los que tenía más fonemas),
y el idioma Rotoka, hablado en Papúa Nueva Guinea, que es el que tiene menos fonemas:
sólo 11.
Además, si observamos el mapa (Imag. 1. [3]) que muestra dónde se habla Rotoka y dónde
se habla !Xoon, podemos observar lo que propone el Quentin D. Atkinson: que es posible que
las lengua modernas desciendan de una única lengua ancestral hablada en África, puesto
que el número de fonemas va decreciendo a medida que nos vamos alejando de África.
En nuestro trabajo hemos analizado los sistemas fonológicos de 41 idiomas hablados en toda
La Tierra. La selección la hemos realizado de manera aleatoria, intentando que estén
representados países de todas las latitudes del globo terráqueo. Además, hemos calculado
cuántos fonemas vocálicos y cuántos consonánticos tienen de media los idiomas hablados
en los dos Polos, los dos Trópicos, el Ecuador y en los países que pertenecen a dos zonas
climáticas terrestres (ver Imag. 2.). Así comprobamos si las latitudes influyen en el número de
fonemas de un tipo u otro.
Para obtener los datos de nuestro estudio hemos usado distintas páginas web donde hemos
podido encontrar el número de fonemas vocálicos y consonánticos de los idiomas más
hablados o más curiosos del mundo. Cuando hablamos de curiosos en este contexto nos
estamos refiriendo a los que tienen más fonemas o menos fonemas, por ejemplo, aunque
sean hablados por una minoría.
Queremos destacar el uso de páginas web como Wikipedia o Amazon Polly, el servicio en la
nube de Amazon para convertir texto en habla realista, donde se muestra el conjunto de
fonema del Alfabeto Fonético Internacional (IPA, por sus siglas en inglés), los símbolos del
Alfabeto Fonético Extendido SAM (X-SAMPA, por sus siglas en inglés) y los correspondientes
visemas (palabras habladas) para las voces que admite este servicio.
Los 41 idiomas que hemos estudiado, los países donde se hablan y las zonas de la Tierra a
la que pertenecen dichos países (ver Imag. 2) son los que aparecen en la tabla siguiente
(Tabla 1).
F. F.
Zona de La Tierra País Idioma
Vocálicos Consonánticos
Ecuatorial Bangladesh Bengalí 7 29
Portugués
Ecuatorial Brasil 12 23
(Brasil)
Ecuatorial Etiopía y Kenia Oromo 10 27
Ecuatorial India Hindi 20 19
Ecuatorial India Inglés (India) 20 27
Ecuatorial India Sri Lanka Tamil 12 27
Ecuatorial Papua Nueva Guinea Rotoka 5 6
Uganda, Mozanbique,
Ecuatorial Congo Ruanda, Burundi, Suajili 5 36
Somalia y Zambia
Ecuatorial Vietnam Vietnamita 21 22
Ecuatorial y Trópico Árabe
6 28
de Cáncer estándar
Media: es una media de tendencia central cuyo resultado se obtiene al dividir la suma de
varias cantidades por el número de sumandos. Es el promedio de un conjunto de valores.
∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ = 𝑛
∑𝑖=1 𝑓𝑖
Desviación típica: la desviación estándar (también representada por la letra griega
minúscula sigma σ o la letra latina s, así como por las siglas SD -de standard deviation- en
algunos textos traducidos del inglés) es una medida que se usa para cuantificar la variación
o dispersión de un conjunto de datos numéricos. Es la raíz cuadrada de la varianza de la
variable que se está estudiando.
∑𝑛𝑖=1 𝑥𝑖2 𝑓𝑖
𝜎=√ 𝑛 − 𝑥̅ 2
∑𝑖=1 𝑓𝑖
𝜎
𝐶. 𝑉. =
𝑥̅
Mediana: Es el número intermedio de un grupo de números; es decir, la mitad de los números
son superiores a la mediana y la mitad de los números tienen valores menores que la
mediana.
4. Tablas y gráficos.
F. Vocálicos Media Desviación Típica C.V. Mediana Moda
A la vista de las últimas tablas mostradas en el apartado anterior, las que muestran los
parámetros estadísticos para los fonemas vocálicos y consonánticos de los idiomas hablados
en los países de las distintas zonas terrestres, podemos concluir que nuestra hipótesis de
partida no es cierta, puesto que, los países de las zonas tropicales tienen un mayor
número de fonemas vocálicos (15,42) y consonánticos (32,38) de media. No obstante,
las desviaciones típicas de los idiomas de las zonas tropicales son las mayores: 7,66 para los
fonemas vocálicos y 19,12 para los fonemas consonánticos. Es más, aun considerando los
idiomas de los países que están en las zonas Ecuatorial y Ecuatorial- Tropical, la media de
fonemas vocálicos es 11,85 y la media de fonemas consonánticos es 25, lo que sigue estando
por debajo de las medias respectivas de los idiomas hablados en los países de las zonas
tropicales.
La dispersión del número de fonemas vocálicos (ver Tabla 4) de los idiomas hablados en
países de zonas Tropicales con respecto a la media de estos fonemas es del 49,64%,
mientras que para los fonemas consonánticos es del 59,06%, siendo estás las
dispersiones más elevadas por detrás de la de los fonemas vocálicos de los idiomas de los
países de zonas Ecuatorial y Tropicales, que es del 60,98%. Cabe destacar la baja
dispersión tanto a nivel de fonemas vocálicos (20,20%), como de fonemas consonánticos
(4,29%) de los idiomas hablados en las zonas polares, siendo las más bajas detrás de la
dispersión de los fonemas consonánticos en las zonas Ecuatorial y Tropicales, que es del
3,51%. Por lo que los idiomas hablados en los países de zonas ecuatoriales y tropicales
son los que tienen una mayor dispersión de fonemas vocálicos (60,98%) y una menor
dispersión de fonemas consonánticos (3,51%).
Dispersión F. Vocálicos Dispersión F. Consonánticos
Si nos fijamos en los dos últimos diagramas de barras, podemos observar que de media los
países de las zonas Tropicales tienen idiomas con más fonemas consonánticos y vocálicos,
que los idiomas del resto de La Tierra. Además, el diagrama de barras se asemeja a una
distribución normal donde los idiomas de los extremos presentan de media menos fonemas
que los del centro. Estos idiomas se corresponden con los de las zonas Ecuatorial y Polares,
lo cual contradice nuestra hipótesis de partida (que los idiomas hablados en las zonas cálidas
(Ecuatorial) iban a tener más fonemas vocálicos), pero nos permite extraer otras
conclusiones, como que en los extremos (mucho frío o mucho calor) el número de fonemas
es menor, en general.
Por otro lado, si comparamos los idiomas hablados en las zonas Polares con los idiomas
hablados en la zona Ecuatorial, los diagramas de barras muestran como el número de
fonemas, tanto vocálicos como consonánticos, es menor en las zonas polares.
6. Conclusiones.
Como hemos señalado antes nuestra hipótesis de partida no es cierta puesto que los países
de las zonas tropicales son los que tienen un mayor número de fonemas, tanto vocálicos
como consonánticos. No obstante, habría que matizar que las zonas tropicales abarcan
países muy cálidos como Marruecos, por ejemplo, y muy fríos como Islandia, por ejemplo,
por lo que el trabajo debería haberse realizado teniendo en cuenta las variaciones térmicas
de los países y no su latitud.
Nuestros resultados también contradicen los resultados obtenidos por Quentin D. Atkinson
[13] puesto que él concluye que en los idiomas desciende el número de fonemas conforme
los países donde se hablan están más alejados de África. En nuestro caso, concluimos que
el número de fonemas de los idiomas desciende conforme nos vamos alejando de los países
situados en las zonas Tropicales. Con esto no queremos decir que los resultados del Quentin
D. Atkinson sean incorrectos, sino que son distintos y el motivo tal vez sea el tamaño de las
muestras: el analizó 504 lenguas y nosotros sólo 41.
Webgrafía y bibliografía:
[1] https://sottovoce.hypotheses.org/992
[2] https://unaracnidounacamiseta.com/2011/10/07/lengua-con-menos-fonemas/
[3] https://unaracnidounacamiseta.com/2011/12/02/lengua-mas-fonemas/
[4] https://docs.aws.amazon.com/es_es/polly/latest/dg/ref-phoneme-tables-shell.html
[5] https://es.wikipedia.org/wiki/Fonolog%C3%ADa_del_%C3%A1rabe
[6]
https://www.giusseppe.net/proyectos/lenguas/recursos/www.linguasport.com/WORLD%20L
ANGUAGES/INDO-EUROPEAN/INDO-EUROPEAN/INDO-IRANIAN/Punjabi.htm#3
[7]
https://es.wikipedia.org/wiki/Lenguas_de_%C3%81frica#Lenguas_por_n%C3%BAmero_de_
hablantes
[8] https://www.facebook.com/estudiosbereberes/posts/c%C3%B3mo-se-pronuncia-en-
bereber-curiosidadessi-no-ves-bien-los-caracteres-abre-el-f/303609779824307/
[9] https://es.quora.com/Cu%C3%A1ntos-fonemas-existen-en-los-idiomas-conocidos
[10] https://www.thefreedictionary.com/
[11] www.ecured.cu
[12] https://es.wikipedia.org/wiki/Desviaci%C3%B3n_t%C3%ADpica
[13] https://sottovoce.hypotheses.org/992
[14] Atkinson, Q. (2011). Phonemic Diversity Supports a Serial Founder Effect Model of
Language Expansion from Africa. Science, 332, 346-348.
[15] Coupé, C. y Maddieson, I. (2016). Quelle adaptation acoustique pour les langues du
monde? CFA/VISHNO 2016, 2335-2340.
[16] Everett, C. (2013). Evidence for Direct Geographic Influences on Linguistic Sounds: The
Case of Ejectives. PLoS ONE 8(6), e65275.
[17] Everett, C. (2017). Languages in Drier Climates Use Fewer Vowels. Frontiers in
Psychology, 8:1285. doi: 10.3389/fpsyg.2017.01285
[18] Everett, C., Blasi, D.E., Roberts, S.G. (2015). Climate, vocal folds, and tonal languages:
Connecting the physiological and geographic dots. PNAS, 112(5), 1322–1327.
[19] Maddieson, I. y Coupé, C. (2015). Human spoken language diversity and the acoustic
adaptation hypothesis. Acoust. Soc. Am., 138(3), 1838–1838.
[20] Nieto, M., Moreno, A., Maestre Blanco, N.A., Pérez, A. Matemáticas. 1º ESO. Savia. Ed.
SM (2017). ISBN: 9788467581447