Вы находитесь на странице: 1из 20

A NLISIS ACSTICO DE LA VOZ NORMAL Y PATOLGICA UTILIZANDO DOS SISTEMAS

DIFERENTES : ANAGRAF Y PRAAT

A COUSTIC ANALYSIS OF NORMAL AND PATHOLOGICAL VOICES USING TWO DIFFERENT


SYSTEMS : ANAGRAF AND PRAAT

N ATALIA G ABRIELA E LISEI *

*Licenciada Fonoaudiloga. Becaria de Doctorado del Consejo Nacional de Investigaciones


Cientficas y Tcnicas (CONICET). E-Mail: natalia.elisei@gmail.com
Grecia 3644, 3er Piso, Dpto. B, (1429) Ciudad Autnoma de Buenos Aires, Repblica Argentina.

RESUMEN didos con PRAAT y resultaron superiores utili-


zando ANAGRAF.
La necesidad de una evaluacin instrumental La confiabilidad de los valores obtenidos con
y objetiva de la calidad de voz se refleja en el ambos programas se redujo significativamente
creciente nmero de mtodos de anlisis acs- con el aumento de las irregularidades en la seal.
ticos desarrollados para el diagnstico clnico y Por lo tanto, parece importante establecer nor-
la investigacin. mas para las voces normales y patolgicas con
En el trabajo que se informa se realizaron el fin de guiar o dar un paso ms en la validez y
anlisis acsticos utilizando dos programas di- confiabilidad de las prcticas profesionales.
ferentes: PRAAT y ANAGRAF. Ambos sistemas
son programas informticos de uso comn en Palabras clave: Anlisis acsticos; Anlisis de
Latinoamrica, en contextos clnicos y de in- voz normal y patolgica; PRAAT; ANAGRAF.
vestigacin, para detectar y caracterizar el habla,
la voz y los desrdenes vocales. El propsito fue
comparar los resultados obtenidos con un con- ABSTRACT
junto de mediciones acsticas, muchas de las
cuales se definen de manera similar en ambos The need for instrumental objective assessment
programas y analizar si se puede distinguir cl- of voice quality is reflected in the increasing
nicamente entre la normalidad y la patologa en number of acoustic analysis methods developed for
sus diferentes niveles de severidad. Un total de clinical diagnosis and as research outcome in the
776 muestras de voz correspondientes a 4 repe- area. Acoustics measures of vocal productions
ticiones de la vocal /a/ de 194 hablantes de es- received much attention in the literature and a
paol en Buenos Aires se midieron utilizando los variety of commercial packages are available.
parmetros disponibles como lo son: la fre- Those systems packages are presented as objective
cuencia fundamental, jitter, shimmer y harmo- tools with apparently standardized, well-designed
nic-to-noise ratio. Los resultados muestran va- measurement protocols and acceptably low inci-
lores similares de frecuencia fundamental (F0) dence of technical problems. The fact of using the
para ambos programas. Sin embargo, los valores same labels for similar measurement output like
de jitter, shimmer y harmonic-to-noise ratio mean jitter or mean shimmer induce to think that
(HNR) fueron significativamente menores me- results from different programs are comparable.

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 339


Elisei

However, there is no standardization of tech- considering both cases as false positives or false
nique methodology and considerable variability is negatives.
observed about which acoustic parameters must be Results demonstrate that the reliability of the
measured. Furthermore, product documentation values obtained by both programs was significantly
often makes it difficult to know how a particular reduced with the increase of irregularities in the
system actually produces its measurements. Little signal. Parameters related with shimmer were more
formal information is available about the actual reliable than parameters related with jitter.
comparability of measures from different analysis For the normal data, r Pearson correlations
packages. ranged from .72 (ANAGRAF) to .87 (PRAAT) for
In this study, acoustic analysis was performed measures of jitter, with lower correlations among
using two different programs: PRAAT and ANA- measures of shimmer .27 (ANAGRAF) to .80
GRAF. Both systems are computer programs (PRAAT) and noise measures .55 (ANAGRAF) to
commonly used in Latin America, in clinical and .87 (PRAAT). The large differences found between
research to detect and characterize speech and voice the measurements from the systems imply that the
disorders. PRAAT, was designed by Boersma and accuracy of the measurements are questionable,
Weenink (2009) and ANAGRAF is a national soft- especially for severely pathological samples.
ware designed by Gurlekian (1997). Therefore, it seems important to establish
The purpose of this work was to compare the normal and pathological voice standards norms for
results obtained by a set of acoustic parameters, Spanish in Buenos Aires to take a step in the
many of which are defined similarly in both validity and reliability of the professional practices.
programs, and analyze whether it can distinguish Future research be aimed at establishing differ-
clinically between normal and pathological voices ences between vowels in addition to sex and
within different severity levels. system used.
A total of 776 voice samples corresponding to
4 repetitions of the vowel /a/ of 194 speakers of Key words: Acoustic analysis; Normal and
Spanish in Buenos Aires were measured using the pathological voice analysis; PRAAT; ANAGRAF.
available parameters such as: the fundamental
frequency, jitter, shimmer, and noise-to harmonic
ratio. The LilliefordsTest, with a significance level
of 5%, was used to verify the normal distribution of
the results of each measurement. The parameters
with normal distribution had their means compared
to the standard measurements proposed by the INTRODUCCIN
program using the t test (significance level of 5%).
General results separated by sex are reported. La voz humana constituye el medio ms
The findings of analyzed voice samples are showed rpido y sencillo para comunicarse. Con el
by definitions for mean, standard deviation, and desarrollo de las tecnologas en telecomuni-
thresholds of normal for each parameter, which caciones ha aumentado considerablemente
helps the clinician to immediately assess the el uso de la voz as como tambin se han in-
findings for a particular patient. The test-retest crementado los desrdenes vocales, que ocu-
reliability in each pair of measures was calculated. rren en un 3 a 9% de la poblacin.
For both programs the results show similar Desafortunadamente, a pesar de la po-
values of fundamental frequency (F0). However, tencia con la que se pueden computar los da-
the values of jitter, shimmer and harmonic-to-noise tos, no parece ser completamente posible
ratio (HNR) were significantly lower measured by analizar la voz humana objetivamente y co-
PRAAT, and higher using ANAGRAF in relation nocer ms profundamente cules son los
which the default results proposed by each system. procesos que gobiernan la produccin de la
The empirical evidence shows that if followed the voz. Aunque las tcnicas modernas pueden
default values and thresholds of each system, the analizar la voz, an existen temas conflicti-
diagnostic accuracy might be questioned by vos e irresueltos.

340 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Anlisis acstico de la voz normal y patolgica

Cuando se intenta detectar y caracterizar Kreiman, Gerratt, Dauer & Berke, 1993;
las voces patolgicas en la clnica, el obje- Boersma, 2009; Burris, 2011; Godino-Llo-
tivo es documentar sus cambios signifi- rente, Osma-Ruiz, Saenz-Lechon, Cobeta-
cativos, es decir, aquellos que no resulten Marco, Gonzalez-Herranz & Ramirez-Cal-
despreciables ni producto del azar. Estos vo, 2008; Oguz, Kilic & Safak, 2011) que
cambios pueden documentarse a travs de la mostraron la existencia de variaciones en la
evaluacin perceptual visual y/o auditiva y precisin con la que los diferentes progra-
el anlisis acstico de la seal. La evalua- mas determinan el perodo y la amplitud de
cin perceptual visual identifica las pato- una seal vocal (estrategias de voicing). Los
logas larngeas mediante la observacin valores no son exactos ni comparables entre
directa de las cuerdas vocales (fibrolarin- s, aunque algunos estudios establecieron
goscopa, videoestroboscopa larngea, etc.). relaciones entre medidas (Boersma, 2009;
Este tipo de exploracin subjetiva tiene ml- Deliyskiy & Boersma, 1993).
tiples desventajas, entre las que se encuen- Este artculo propone describir, analizar y
tran su alto costo, la duracin de la propia discutir los valores de las medidas acsticas
exploracin y el hecho de tratarse de tcni- calculadas por dos sistemas de anlisis obje-
cas invasivas. tivos y muy conocidos, uno nacional y otro
El anlisis perceptual auditivo est sien- extranjero, como son ANAGRAF (Gurlekian,
do revisado y cuestionado actualmente en la 1997, 2001) y PRAAT (Boersma, 2009).
literatura universal. La seleccin y la defi- Especficamente, el objetivo fue estudiar
nicin de escalas perceptuales auditivas han en hablantes del espaol de Buenos Aires, los
sido controvertidas y no siempre comunes a valores de tendencia central y dispersin que
todos los especialistas en voz. asumen voces normales y patolgicas medi-
En este contexto, el uso de las medicio- dos con ambos sistemas e interpretar su
nes acsticas como estudio de diagnstico ajuste con los valores estndares propuestos
complementario de voces patolgicas en el por defecto por los mismos programas. Fi-
mbito clnico se ha incrementado hasta nalmente, se pretende establecer valores
convertirse en rutinas. El anlisis acstico guas, que constituyan un aporte a la prctica
ofrece ventajas ya conocidas, no es costoso, clnica diaria, para la voz normal y patol-
es fcil de usar y no es invasivo. El mayor gica segn su grado de severidad, conside-
problema del uso de medidas acsticas es la rando la confiabilidad propia de cada medi-
interpretacin de las mismas. Al utilizar cin.
mtodos de anlisis acstico se miden de
forma computarizada las propiedades espe-
cficas de una forma de onda de seal de MTODO
voz, semejante a la producida por el pa-
ciente, pero modelada por una teora. La MATERIALES Y PROCEDIMIENTO
aplicacin de los diferentes mtodos exige
entender y visibilizar los principios que los Para el anlisis acstico lineal tradicio-
operan. Segn Baken y Orlikoff (2000), se nal se utilizaron las vocales /a/ del espaol
ha sido muy condescendiente y no se han de Buenos Aires registradas en la Base de
cuestionado los procedimientos o los su- Datos de Alteraciones de la Voz y el Habla
puestos, indocumentados muchas veces, en (Elisei, 2011) integrada por las emisiones de
los que se basan los sistemas de anlisis que 66 hablantes normales (H) y 128 hablantes
se compran y se utilizan. Estos autores su- con patologa vocal (P).
gieren ser ms sofisticados y ms escp- Se analizaron 194 sujetos hablantes del
ticos en favor de un diagnstico ms pre- Espaol de Buenos Aires, de los cuales 78
ciso. (40.2%) eran hombres y 116 (59.8%), mu-
Con este propsito se realizaron compa- jeres. La media de edad fue igual a 36.35
raciones entre sistemas (Bielamowicz, aos con una desviacin estndar de 16.059.

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 341


Elisei

Las voces de individuos normales pertene- muestras se editaron a travs del programa
cen a 33 hombres y 33 mujeres, con edades Sound Forge Versin 8.0b. Slo el cuerpo de
promedio de 27.38 7.9 y 26.78 7.9 aos, la seal se utiliz para el anlisis acstico, lo
respectivamente (se indica el valor medio que se realiz manualmente. La edicin de
el desvo estndar). El conjunto de voces pa- cada sonido se realiz tomando el cuerpo de
tolgicas contiene muestras de 45 hablantes la emisin y desechando el ataque y la fila-
masculinos y 83 femeninos. El promedio de tura de cada muestra.
edad en este caso fue de 45.88 22.02 y Para analizar las seales voclicas se em-
38.31 15.68 aos para el grupo de hablan- ple la funcionalidad del Voice Report de
tes masculinos y femeninos, respectiva- PRAAT Doing Phonetics by Computer, ver-
mente. sin 4.6.06 y de ANAGRAF versin V09.10
Los diagnsticos etiolgicos presentes en con la funcin de reporte desarrollado ad-
la base de datos son variados: lesiones es- hoc en el Laboratorio de Investigaciones
tructurales mnimas, congestin por reflujo Sensoriales para analizar estos datos. Se mi-
gastroesofgico, papilomatosis, granulomas, dieron y analizaron un total de 25 medicio-
hiperfuncin, hiperplasia, queratosis, edema nes acsticas lineales tradicionales. Una
de cuerdas vocales, plipos cordales, fona- ventaja comparativa de PRAAT es que per-
cin ventricular, tejido de cicatrizacin, tem- mite a travs de los scripts, realizar una se-
blor vocal, estenosis larngeas y parlisis cuencia de comandos para agilizar el anli-
cordales, entre otras. sis de muestras.
El corpus empleado para este estudio in-
cluy 2.995 muestras vocales correspon-
dientes a tres repeticiones de la vocal /a/ del
Espaol de Buenos Aires, ms una emisin RESULTADOS
sostenida durante el tiempo mximo fona-
torio de cada sujeto. Los resultados comparativos se agrupan
Previo al registro de sus voces, los parti- en dos secciones. La primera se refiere al es-
cipantes respondieron a un breve cuestiona- tudio de los hablantes con voces normales en
rio relacionado con factores de riesgo. Se tanto se describen los valores de las medidas
instruy a los participantes para que pro- acsticas para cada sistema y su relacin
nunciaran en tres oportunidades la vocal /a/ con los valores umbrales o puntos de corte
de manera sostenida (tiempo estimado: de 3 estndares configurados por defecto.
a 5 segundos), a una intensidad y frecuencia La segunda seccin incluye en el anlisis
espontneas. de la poblacin de hablantes con voces pa-
Las emisiones fueron grabadas digital- tolgicas y describe, distinguiendo cada sis-
mente en una computadora de escritorio uti- tema, la confiabilidad de las medidas en fun-
lizando una placa de sonido externa USB cin del grado de severidad.
marca M-Audio Firewire modelo 1410. Se
utiliz un micrfono AGK D770, tipo din-
mico unidireccional cardioide, con un rango SECCIN I. VALORES NORMALES
de frecuencia de 60 Hz-20 kHz, sensibilidad
de 2,5 mV/Pa (-52 dBV) e impedancia de En este primer estudio se realizaron las
600 Ohm situado a 10 cm de la boca en una comparaciones de los resultados medidos
sala acstica y antecmara con nivel de en voces normales (de ahora en ms, H) en
ruido de 35 dB y tiempo de reverberacin cada programa (PRAAT y ANAGRAF) con
menor a 1 segundo. El material fue regis- aquellos dados por defecto. Inicialmente se
trado con un nivel de calidad de 16 bits y aplic el test de Kolmogorov-Smirnov para
una frecuencia de muestreo de 44.100 mues- corroborar la distribucin normal de los da-
tras por segundo y no se utiliz ningn tipo tos y luego el test t de Student para la vocal
de compresin. Una vez que se tomaron las /a/ de hombres y mujeres del grupo H. Los

342 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Anlisis acstico de la voz normal y patolgica

resultados de estos procedimientos se resu- MEDICIONES DE LA PERTURBACIN EN FRECUENCIA


men en las tablas 1 y 2, se detallan y discu-
ten considerando las medidas individual- A diferencia de las medidas anteriores
mente. que se muestran como un ndice de la esta-
bilidad, la perturbacin de la frecuencia
(jitter) es la variabilidad de la frecuencia
MEDICIONES DE FRECUENCIA FUNDAMENTAL fundamental en ciclos consecutivos. Las me-
didas de jitter se relacionan con la variacin
El clculo preciso de la frecuencia fun- en el corto plazo: el jitter mide cunto difiere
damental (F0) de la seal de habla es un re- un perodo dado del perodo que lo sucede
quisito indispensable para procesamientos inmediatamente (Lieberman, 1961). Es im-
posteriores. La evaluacin de parmetros re- portante considerar que se han reportado
lacionados con la variacin de la F0 depen- importantes diferencias de aproximada-
de fuertemente de que sta haya sido esti- mente el 22.5% en la estimacin del jitter a
mada con el mnimo error posible. partir de la seal acstica y la electrogloto-
Como se observa en la Tabla 1, la media grfica (Vieira, McInnes & Jack, 1996,
de la frecuencia fundamental (F0) medida 2002).
con PRAAT en la muestra de sujetos nor- Este parmetro es uno de los ms emple-
males (H) es igual a 119 Hz ( 20) para los ados y con mayor tradicin tanto en la cl-
varones y 207 Hz ( 24) para las mujeres, nica como en la investigacin. El valor me-
con importantes variaciones en ambos gru- dio del Jitta en la muestra estudiada fue de
pos. 13.86 microsegundos (s) para las mujeres
La medicin de frecuencia fundamental y de 31.31 s para los hombres, mostrando
en ANAGRAF ofrece tres posibilidades: alta variabilidad observable en los desvos
f0_pr, fc_cp y f0_cc. El primero, (f0_pr) se estndar, principalmente en las voces mas-
calcula con un mtodo de correlacin culinas. Estos valores son inferiores a los re-
(RAPT); el segundo se calcula con un m- ferenciados por PRAAT como normativos
todo frecuencial (cepstral) y con el tercero (83.2 s).
se realiza un clculo temporal: ciclo a ciclo. Otro tipo de medicin clnica interesante
Este ltimo es el menos confiable, pero el es el Jitt que considera en trminos relativos
ms arriesgado en casos que los otros mto- o porcentuales la variacin respecto al per-
dos no permitan calcular. Por ello, es la in- odo. En la muestra estudiada las mujeres
formada en el reporte de ANAGRAF. En presentaron un .29% de variabilidad con res-
este estudio slo se midieron dos: F0_pr y pecto a la fundamental y los hombres, un
F0_cc. En la Tabla 2 se observa que los va- .35%. Los resultados se asemejan a los re-
lores obtenidos son semejantes a PRAAT portados por otros autores que obtienen
cuando se mide con f0_pr y presentan mayor .42% en varones de 26 - 33 aos (Orlikoff,
variacin cuando se lo compara con f0_cc, 1990).
confirmando as lo dicho anteriormente so- Para minimizar los posibles errores de
bre su menor confiabilidad. estimacin o extraccin del F0 tambin se
Los resultados obtenidos con ambos pro- utilizan algoritmos que suavizan o estilizan
gramas concuerdan con lo que se esperaba los contornos promediando 3 perodos con-
debido a las diferencias entre sexos para to- secutivos (RAP), 5 perodos (PPQ). Los
dos los parmetros relacionados con la fre- nuevos valores resultan de la diferencia ab-
cuencia fundamental, encontrndose mayor soluta promedio entre un perodo y el pro-
variabilidad en el sexo femenino. El rango medio entre ste y sus cuatro vecinos ms
de valores para la frecuencia fundamental cercanos, dividido por el perodo promedio.
(F0) se extiende de 87 a 181-182 Hz para los Los valores medidos en esta muestra resul-
varones y de 165 a 262-265 Hz para las mu- taron muy inferiores a los datos normativos
jeres. del manual del PRAAT (.16% para RAP y

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 343


Elisei

.17% para PPQ en mujeres y .18% para RAP MEDICIONES DE RUIDO


y .21% para PPQ en hombres) y a otros de
trabajos norteamericanos y japoneses (Dwire La relacin armnico-ruido (HNR) es una
& McCauley, 1995; Preciado & Fernndez, medida que cuantifica la cantidad de ruido
1998; Preciado, Garca & Infante, 1998; aditivo en la seal de la voz. Consiste en el
Takahashi & Koike, 1975). Sin embargo, son cociente entre la energa espectral debida a
similares a los obtenidos en Espaa (Fer- las componentes armnicas de la seal y la
nndez et al., 1999) en una muestra de 154 correspondiente al ruido. En ANAGRAF, la
adultos no fumadores (PPQ = .23%) e in- media de la relacin armnico-ruido (HNR)
cluso al del grupo de fumadores del estudio en el grupo H fue igual a 6,53 dB y 6,63 dB
(Damborenea et al., 1999; Fernndez et al., para mujeres y hombres, respectivamente.
1999) (PPQ = .27%) y en los de Walton y Or- En este caso la muestra analizada supera los
likoff (1994) (RAP = .28%). valores dados como normales. Se supone
En ANAGRAF, la media de Jitter_pr para que esto es consecuencia de la alta exigen-
el grupo H fue igual a 1.35% para mujeres y cia en los criterios de inclusin impuestos a
a 1.02% para los hombres, superando los la seleccin de la muestra del grupo de vo-
valores dados por el programa (< 1%) como ces normales (H).
normalidad. Para calcular el Jitter cc se re- PRAAT propone que una medida original
quiere calcular el F0cc y como este clculo de HNR debe ser de 20 para /a/ /i/ y de 40
no es confiable, en ANAGRAF se debe para la vocal /u/. En consecuencia, una
cumplir la condicin que el F0cc d igual al HNR por debajo de 20 es considerada como
F0prom (calculado por el mtodo RAPT) una medida de notable ronquera. En la
para aceptar como confiable el valor de muestra estudiada se encontr HNR de
jitter cc (Gurlekian, 2001). 24,35 y 22,07 para mujeres y hombres, res-
pectivamente.

MEDICIONES DE LA PERTURBACIN EN AMPLITUD


SECCIN II. VALORES PATOLGICOS
Las medidas de perturbacin de la ampli-
tud, o shimmer, son anlogas a los ndices de Se han resumido, en los casos en que ha
jitter. Sin embargo, si bien cuenta con tradi- sido posible, los datos en tablas que intentan
cin en la clnica no ha sido tan estudiado aproximar a normas, entindase medias, des-
como el jitter. Tampoco es clara la relacin viaciones tpicas y rango de valores de los
del shimmer con anormalidades especficas parmetros de ANAGRAF y PRAAT. Slo
de la funcin gltica, pero los valores tienden intentan servir como guas para interpretar
a normalizarse cuando se reduce la patologa los resultados.
larngea. Todos los valores medios para hom- Para cada grupo y sexo se compararon los
bres y mujeres medidos en la muestra anali- valores medios de frecuencia fundamental,
zada son muy inferiores a los valores nor- perturbacin de la frecuencia y perturbacin
mativos del programa (ShimdB = .16 dB y de la amplitud y ruido de la vocal /a/ del Es-
.26 dB para mujeres y hombres, respectiva- paol de Buenos Aires, que es la vocal in-
mente) y a los reportados por otros autores formada en la clnica. Se analizaron estos
(Fernndez et al., 1999; Horii, 1979; Precia- valores con relacin a los puntos de corte
do & Fernndez, 1998) (ver Tabla 1). que establece cada medicin en cada sis-
En ANAGRAF, la media de shimmer tema en comparacin.
para el grupo H fue igual a .27 dB para mu- Muchas de las mediciones son tiles para
jeres y .32 dB para los hombres, ubicndose un amplio espectro de desrdenes vocales,
dentro de los valores de normalidad dados por lo que la clasificacin por tipo de pato-
por el programa (.30 dB) (ver Tabla 2). loga no result la adecuada, pero s se con-

344 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Anlisis acstico de la voz normal y patolgica

sider desagregarlas y analizarlas segn su cia de que los valores de jitter son menores
grado de severidad y confiabilidad. (ver Tabla 3).

MEDICIONES DE FRECUENCIA FUNDAMENTAL MEDICIONES DE LA PERTURBACIN EN AMPLITUD


Se observ que en el Grupo P aument la En las medidas de shimmer pareciera en-
variabilidad en todos los parmetros medi- contrarse una mayor consistencia. Tanto en
dos y esto se reflej especialmente en la PRAAT como ANAGRAF los valores me-
medida de desvo estndar. En las mujeres, dios medidos para voces normales y patol-
el F0 disminuye y en hombres aumenta, gicas concuerdan ms con las medias y um-
mientras que la medida de mximo tono au- brales dados por los sistemas. Un ejemplo en
menta en ambos (ver Tablas 3 y 4). PRAAT es el Shim% medido en las mujeres
que se aproxima con valores medios de
1.81% .51 y 3.49% 2.49 para normales
MEDICIONES DE LA PERTURBACIN EN FRECUENCIA y patolgicos, respectivamente, al umbral
que es 2.52%. Sin embargo, en los hombres
Al analizar las medidas de perturbacin los valores medios medidos son superiores
en PRAAT: Jitt, Jita, RAP y PPQ en las mu- (Shim% = 2.93 1.53 y 5.86 4.93 para H
jeres de la muestra, los valores medios nor- y P, respectivamente) tanto a la media como
males resultaron muy inferiores (Jitt = .29%; al umbral (media = 2.52% y um-
Jitta = 13.86 s) como as tambin los valo- bral = 3.81%) propuesto por PRAAT, por lo
res patolgicos. que voces normales de la muestra pasaran
Si no son desagregados los grupos por por patolgicas (ver Tabla 6).
sexo y se considera, adems del valor medio, En ANAGRAF esta medida tiene la
el desvo estndar, el valor que se obtiene misma limitacin si se incluye en el anlisis,
como rango superior no llega a superar el el desvo estndar tanto en mujeres como en
umbral que el programa informa como punto hombres. En la muestra estudiada los valo-
de corte entre la normalidad y la patologa. res medios de normalidad van de .27 .67
Cabe aclarar que en este caso, el grupo de dB (mujeres) y .32 .12 dB (hombres). Si se
normalidad es de una normalidad rigurosa considera un umbral en .30 dB, se estaran
en tanto se trata de hablantes locutores en- categorizando casos normales como pato-
trenados, con lo cual se flexibilizara el lgicos (ver Tabla 3).
rango superior, pero habra que estudiar qu
ocurre en una muestra de no entrenados y, si
en verdad se llega a equiparar el umbral MEDICIONES DE RUIDO
configurado por el programa. Cuando se
desagrega por sexo, se verifica que en los Los valores medidos de HNR en ANA-
hombres esto no ocurre y los umbrales po- GRAF tanto en hombres como en mujeres
dran considerarse concordantes excepto mostraron ser relativamente ajustados aun
para PPQ donde se encuentra la misma di- considerando los desvos estndares en el
ferencia que en las mujeres (ver Tabla 5). anlisis (ver Tabla 3).
En ANAGRAF, los valores normales me-
dios medidos del parmetro jitter_cc, son su-
periores al umbral. Si se tiene en cuenta el MEDIDAS SEGN EL GRADO DE SEVERIDAD DE LAS
desvo estndar, los valores obtenidos PATOLOGAS
(jitter_cc = 3.37%) se pueden interpretar
cmo voces normales pero seran categori- Se analizaron las mismas medidas ante-
zadas como patolgicas cuando no lo son. riormente descriptas por el grado de severi-
En los hombres ocurre lo mismo, a diferen- dad de la patologa (Elisei, 2011) para eva-

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 345


Elisei

luar si la influencia de la variedad diagns- para todos los parmetros a excepcin de


tica del hablante normal (N), con patologas f0_pr y f0_cc. Los resultados del test a pos-
leves a moderadas (LM) y moderadas a se- teriori de Dunnet evidenciaron diferencias
veras (MS) haca variar estos resultados. significativas en el parmetro HNR para las
Por no cumplirse el supuesto de homoce- tres categoras tanto N, LM y MS. Para el
dasticidad o supuesto de homogeneidad de parmetro jitter se encontraron diferencias
variancias, para el anlisis de la variancia entre N y MS y para shimmer entre N y MS
(test de Levene) se utiliz el test robusto de y LM y MS, no as entre N y LM. Esto
Brown Forsythe. En la vocal /a/ se encon- muestra que la deteccin en el continuo que
traron diferencias significativas para las va- va desde la normalidad a la patologa no es
riables, exceptuando la media y mediana de tarea sencilla siendo especficamente entre
tono para las mujeres y el mnimo tono para normales (N) y patolgicos leves (LM), las
los hombres. Aplicando el test a posteriori diferencias no significativas.
de Dunnet con un nivel de significacin En resumen, lo que se puede observar en
global del 5% se encontraron diferencias las Tablas 3, 4, 5 y 7 es cmo los valores me-
significativas en todos los parmetros me- dios, los desvos y los rangos aumentan en-
didos exceptuando los sigiuentes casos: tre los grupos segn el grado de severidad y
En mujeres, en la mediana del tono (me- cmo estos desvos y rangos dan cuenta de
dian pitch) y la media del tono (mean pitch) la variancia de cada medicin segn el
entre las 3 categoras: N, LM y MS, de lo grupo. Es interesante pensar que a medida
que se interpreta que estos parmetros no que aumenta la variancia, tambin aumentan
son los ms sensibles a la hora de caracteri- las dudas sobre la sensibilidad de estas me-
zar subgrupos, sino ms bien casi constantes diciones para esos tipos determinados de se-
del sexo. Tampoco se encontraron diferen- ales. Las excepciones son AC y HNR que
cias entre tono mnimo y mximo (minimum disminuyen lgicamente por la degradacin
y maximum pitch) entre LM y MS, pero s en las seales ms patolgicas y NHR que
entre N y LM y N y MS, por lo que se in- parece no encontrar diferencias entre N y
terpreta que esta medida s puede ser rele- LM, dando cuenta nuevamente de que no se-
vante al momento de distinguir entre dife- ra tan evidente hallar diferencias entre vo-
rentes niveles de severidad. Las cinco ces normales y patolgicas leves con esta
medidas de jitter no muestran diferencias medida.
significativas entre LM y MS, pero s con N,
indicando que si bien (an con sus limita-
ciones) son medidas sensibles para distin- CONFIABILIDAD DE LAS MEDIDAS
guir voces normales de patolgicas, no pue-
den caracterizar grados de severidad en Para evaluar el grado de confiabilidad de
patologas. las medidas obtenidas se compar la estabi-
En hombres se encontr que la mediana lidad de los parmetros en una prueba test-
y la media del tono no se diferencian para retest mediante el anlisis de dos muestras
LM y MS pero s logran diferencias signifi- consecutivas de voz tomadas en cada sujeto.
cativas ambos con N. La medida del tono Se utiliz el test de correlacin de Pearson
mnimo se comporta de forma semejante a como medida de confiabilidad. El mtodo
las mujeres: no muestran diferencias signi- del test-retest prev la aplicacin de dos ve-
ficativas entre niveles de severidad, aunque ces el mismo test (el lapso entre las aplica-
s se observan diferencias en el parmetro de ciones se determina previamente), a una mis-
tono mximo en los tres niveles. En tres de ma muestra de individuos. Las dos series de
los jitter no se observan diferencias Jita, puntajes resultantes se correlacionan con el
RAP y DDP, al igual que APQ11. coeficiente de correlacin r de Pearson para
En ANAGRAF se realiz el mismo an- medir el grado de asociacin entre dos va-
lisis encontrndose diferencias significativas riables asumiendo valores entre -1 y 1. Los

346 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Anlisis acstico de la voz normal y patolgica

valores prximos a 1 indicarn fuerte aso- harmonic-to-noise ratio y la frecuencia fun-


ciacin lineal positiva, los valores prximos damental. Hay muchos factores que atentan
a -1 indicarn fuerte asociacin lineal nega- contra la declaracin de que todo puede
tiva y los valores prximos a 0 indicarn no abarcarse en normas. Algunos de ellos son
asociacin lineal, lo que no significa que no especficos de las personas (sexo y edad),
pueda existir otro tipo de asociacin. culturales (lo que para una lengua puede
En las Tablas 3, 4, 5, 6 y 7 se presentan considerarse dentro de lmites normales,
los valores de las correlaciones y se observa puede ser diferente para otra) y en relacin
que es poco probable que esta correlacin se con el entorno de prueba (la variacin en el
d por el azar para la mayora de los par- equipo utilizado y, ms importante an, el
metros. Los coeficientes menores a .7 su- uso de diferentes algoritmos de los progra-
gieren, a diferencia de los dems, que existe mas de software que se utilizan para hacer
una media y baja correlacin entre las mues- las mediciones). Mientras que la evaluacin
tras. La medicin de la frecuencia funda- acstica de la voz se compromete a propor-
mental parece ser estable y confiable; sin cionar una medida objetiva de los parme-
embargo, esta alta correlacin disminuye en tros relevantes, existen muchos elementos
la medida de desviacin estndar dando que influyen en la comparacin de los re-
cuenta all de las discrepancias o variaciones sultados obtenidos en diferentes ocasiones.
que pueden existir en la produccin de un En particular, en el estudio que se informa
tono sostenido. En las mediciones de jitter, se ha centrado la atencin en las diferencias
se observa una estabilidad alta con coefi- entre sistemas frente a un mismo continuo
cientes de .807 a .879 para los normales y de que se extiende de la normalidad a la pato-
moderada a baja con valores entre .881 a loga en sus diferentes grados.
.547 para los patolgicos. Esto se asocia con Los resultados aqu obtenidos sugieren
las limitaciones que encuentran estas medi- que es preferible automatizar el anlisis para
ciones para el clculo cuando la seal con- colaborar en la deteccin de valores dife-
tiene mayores irregularidades y deja de ser rentes y/o errneos. Pareciera importante te-
cuasi peridica. Las mediciones de pertur- ner en cuenta las diferencias de sexo en la
bacin de la amplitud vara entre .831 a .798 mayora de los parmetros explorados, por
en voces normales y de .872 a .691 para las lo que se sugiere considerar los valores nor-
voces patolgicas, mostrando un comporta- mativos desagregados por sexo.
miento semejante a la perturbacin de fre- Los valores de tendencia central y dis-
cuencia. Dentro de los parmetros de ruido, persin medidos en la muestra estudiada de
ambos logran altas consistencias en sus me- hablantes normales verifican diferencias sig-
diciones. Tambin se puede observar que nificativas en relacin a los estndares pro-
LM tiene menor correlacin en general que puestos por defecto por ambos sistemas.
N y MS. Estos valores cobran mayor significancia
cuando se intenta no slo detectar, sino tam-
bin caracterizar la patologa en sus grados
CONCLUSIONES de severidad: normal (N), leve-moderado
(LM) y moderado a severo (MS). Interpre-
En este trabajo se han presentado las me- tando los datos medidos y tomando el punto
diciones tradicionales relacionadas con la de corte o umbral entre la normalidad y la
frecuencia fundamental, la perturbacin de patologa dados por los sistemas, se puede
la frecuencia y la amplitud y la relacin ar- observar que utilizando PRAAT muchos ca-
mnico - ruido, dado que a pesar de no ser sos son subestimados (falsos negativos) y
una medida de aperiodicidad es tradicin con ANAGRAF muchos casos son sobrees-
medirla en la clnica diaria. Es difcil deter- timados (falsos positivos).
minar con precisin las normas para medi- Con el propsito de indagar la confiabi-
das acsticas tales como jitter, shimmer, lidad de las medidas utilizadas se realiz

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 347


Elisei

una prueba de test-retest y se midi la co- veridad de las patologas y confiabilidad de


rrelacin entre los resultados obtenidos. Se cada medida se presentan los valores me-
vio que a medida que aumenta el grado de dios, desvos estndares y rangos medidos
severidad de las patologas, disminuye la en voces normales y patolgicas.
correlacin. Esto se asocia con las limita- La contribucin del estudio que se in-
ciones que encuentran estas mediciones para forma reside en evidenciar estas diferencias
el clculo cuando la seal contiene mayores y proponer guas que las consideren, sobre
irregularidades y deja de ser cuasi peri- todo cuando hay evidencia emprica de que
dica. Cuando esto ocurre, el coeficiente de guiada por los valores medios y umbrales de
correlacin disminuye al punto de hacer cada sistema, la precisin diagnstica podra
poco fiable su valor. ser cuestionada.
Finalmente y atendiendo a las diferen-
cias de sistema empleado, sexo, grado de se-

348 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


TABLA 1
RESULTADOS MEDIDOS CON PRAAT EN MUJERES Y HOMBRES NORMALES

PRAAT VR Resultados medidos mujeres Valores estndar Resultados medidos hombres


p
p Umbral p Umbral

Median_pitch 207 24.2 .01 < .05 200 - 120 .68 119 20.42 .00
Mean_pitch 207 24.1 .00 < .05 200 - 120 .68 119 20.35 .00

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Jitt % .29 .15 .00 < .05 .59 1.04 .54 .35 .13 .00
Jitta (us) 13.86 6.09 .00 > .20* 41.66 83.20 36.48 31.31 14.59 .00
Anlisis acstico de la voz normal y patolgica

RAP % .16 .10 .00 > .20* .35 .68 .33 .18 .08 .00
PPQ % .17 .08 .00 < .10* .34 .84 .29 .21 .08 .00
Shim % 1.81 .51 .00 < .10* 2.52 3.81 1.00 2.93 1.53 .00
ShdB (dB) .16 .04 .00 > .20* .22 .35 .09 .26 .13 .00
APQ % 1.43 .41 .00 > . 20* 1.99 3.07 .81 1.81 .93 .00

*Sigue la distribucin normal. Test de Lilliefords.

349
TABLA 2

350
RESULTADOS MEDIDOS CON ANAGRAF EN MUJERES Y HOMBRES NORMALES

Resultados medidos mujeres Valores estndar Resultados medidos hombres


ANAGRAF
p Umbral p

f0_pr 207 23.97 .01 200 / 120 118 20.45 0


f0_cc 206 25.31 0 200 / 120 118 20.42 .41
jitter-cc 1.35 2.02 .09 1 1.02 1.72 .93
Shimmer .27 .67 .66 .3 .32 .12 .13
HNR 6.53 2.55 0 4 6.63 2.4 0

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Elisei
TABLA 3
RESULTADOS MEDIDOS CON ANAGRAF EN MUJERES Y HOMBRES NORMALES SEGN GRADO DE SEVERIDAD DE LAS PATOLOGAS

Mujeres Hombres
ANAGRAF Fuente n Rango r n Rango

N 98 207 23.969 165 262 .991 98 118 20.45 87 181


f0_pr LM 155 199 27.257 147 280 .975 64 133 21.19 89 180
MS 7 78 193 66.845 0 374 .855 69 147 46.79 90 329

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


N 98 206 25.308 130 268 .986 98 118 20.42 84 182
f0_cc LM 155 200 27.627 148 288 .89 64 131 22.9 65 180
Anlisis acstico de la voz normal y patolgica

MS 78 203 57.72 92 395 .86 69 127 62.01 0 312

N 98 1.35 2.02 .26 10.63 .728 98 1.02 1.72 .21 10


jitter-cc LM 155 4.37 20.43 .11 254 .351 64 3.42 3.35 .32 10
MS 78 9.12 12.45 .12 55.47 .374 69 5.48 3.96 .51 10

N 98 .27 .67 -1.68 6.49 .274 98 .32 .12 .13 .8


shimmer LM 155 .38 .20 .11 1.67 .729 64 .63 .40 .21 2.21
MS 78 .83 1.1 .20 8.14 .808 69 .92 .69 .35 4.23

N 98 6.53 2.55 -.13 10.8 .55 98 6.63 2.4 .01 10.58


HNR LM 155 3.34 2.63 -2.71 8.57 .762 64 2.31 3.0 -5.43 7.78
MS 78 1.26 2.64 -3.86 6.41 .863 69 .06 2.77 -5.4 5.3

Notacin
N: normal
LM: leve-moderada
MS: moderada-severa

351
TABLA 4

352
RESULTADOS DE FRECUENCIA FUNDAMENTAL MEDIDOS CON PRAAT EN MUJERES Y HOMBRES NORMALES SEGN GRADO DE SEVERIDAD
DE LAS PATOLOGAS

Mujeres Hombres
PRAAT Fuente n Rango r n Rango

N 98 206.82 24.2 165 265 .999 98 119 20.42 87 182


Median pitch LM 155 197.6 28.94 103 288 .917 64 132 21.14 88 179
MS 78 199.24 52.71 90 419 .811 66 144 43.98 89 321

N 98 206.89 24.17 165 264 .999 98 119 20.35 87 182


Mean pitch LM 155 197.48 28.61 111 288 .927 64 131 20.71 88 179
MS 78 200.59 49.99 91 422 .874 66 144 41.8 89 295

N 98 1.8 .68 .72 3.47 .045 98 1 .63 1 5


SD LM 155 3.56 8.48 .67 74.35 .332 64 3 6.14 1 43
MS 78 13.14 26.69 .67 145.47 .708 66 10 20.19 1 107

N 98 202.59 23.93 160 258 .998 98 116 20.09 85 179


Minimum pitch LM 155 189.34 35.33 74 277 .086 64 123 22.5 77 176
MS 78 176.37 56.62 74 386 .779 66 122 38.16 73 227

N 98 211.62 24.32 170 268 .997 98 122 22.11 91 184


Maximum pitch LM 155 204.82 29.42 127 308 .919 64 141 23.9 95 196
MS 78 229.95 82.21 102 496 .874 66 163 60.66 93 365

Notacin
N: normal
LM: leve-moderada
MS: moderada-severa

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Elisei
TABLA 5
RESULTADOS DE PERTURBACIN DE LA FRECUENCIA FUNDAMENTAL MEDIDOS CON PRAAT EN MUJERES Y HOMBRES NORMALES SEGN
GRADO DE SEVERIDAD DE LAS PATOLOGAS

Mujeres Hombres
Fuente n Rango r n Rango

N 98 .29 .15 .16 1 .807 98 .35 .13 .16 .95


Jitt LM 155 .42 .31 .09 2.86 .547 64 .74 1.15 .21 8.45
MS 78 .67 .90 .18 5.99 .907 66 1.56 2.36 .23 12.31

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


N 98 13.86 6.09 6.12 41.54 .879 98 31.31 14.59 9.45 90.01
Anlisis acstico de la voz normal y patolgica

Jita LM 155 21.97 16.77 3.76 137.62 .679 64 60.82 100.32 11.65 712.44
MS 78 39.31 68.31 7.64 430.4 .881 66 117.41 184.12 10.97 974.08

N 98 .16 .10 .08 .66 .807 98 .18 .08 .07 .59


RAP LM 155 .24 .17 .05 1.53 .561 64 .42 .73 .11 5.39
MS 78 .34 .37 .10 2.71 .882 66 .89 1.39 .11 6.81

N 98 .17 .08 .09 .66 .816 98 .21 .08 .08 .50


PPQ5 LM 1 155 .25 .21 .06 1.99 .466 64 .40 .51 .13 3.59
MS 78 .38 .46 .10 3.31 .855 66 .91 1.55 .11 9.04

N 98 .48 .29 .23 1.97 .807 98 .55 .25 .2 1.76


DDP LM 155 .71 .52 .14 4.6 .561 64 1.26 2.19 .32 16.17
MS 78 1.02 1.1 .29 8.13 .882 66 2.66 4.16 .31 20.42

Notacin
N: normal
LM: leve-moderada
MS: moderada-severa

353
TABLA 6

354
RESULTADOS DE LA PERTURBACIN DE LA AMPLITUD MEDIDOS CON PRAAT EN MUJERES Y HOMBRES NORMALES SEGN GRADO DE
SEVERIDAD DE LAS PATOLOGAS

Mujeres Hombres
PRAAT Fuente n Rango r n Rango

N 98 1.81 .51 1.02 3.32 .826 98 2.93 1.53 .88 8.76


Shim LM 155 2.71 1.71 .61 14.47 .824 64 4.53 3.17 1.41 15.48
MS 78 5.06 3.02 1.33 12.72 .876 66 7.16 5.92 1.82 24.57

N 98 .16 .04 .09 .29 .831 98 .26 .13 .08 .79


ShdB LM 155 .24 .15 .05 1.31 .836 64 .4 .28 .13 1.39
MS 78 .46 .29 .12 1.22 .872 66 .64 .53 .16 2.2

N 98 .97 .29 .55 1.86 .825 98 1.57 .88 .41 4.67


APQ3 LM 155 1.46 .91 .30 7.72 .827 64 2.4 1.66 .70 8.33
MS 78 2.75 1.67 .59 7.83 .832 66 3.89 3.2 1 12.63

N 98 1.1 .32 .64 2.1 .826 98 1.81 .93 .53 5.46


APQ5 LM 155 1.68 1.14 .37 9.44 .771 64 2.81 2.04 .81 9.77
MS 78 3.04 1.76 .75 7.97 .833 65 4.22 3.63 1.14 20.49

N 98 1.43 .41 .74 2.77 .798 98 2.44 1.22 .81 7.14


APQ11 LM 155 2.06 1.26 .56 10.6 .691 64 3.52 2.47 .96 11.65
MS 78 3.69 2.33 1.05 12.71 .806 63 4.44 2.92 1.4 12.95

N 98 2.91 .88 1.64 5.58 .827 98 4.72 2.63 1.24 14


DDA LM 155 4.38 2.73 .90 23.17 .827 64 7.2 4.98 2.1 24.99
MS 78 8.25 5.02 1.78 23.48 .832 66 11.68 9.59 3.01 37.89

Notacin
N: normal
LM: leve-moderada
MS: moderada-severa

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Elisei
TABLA 7
RESULTADOS DE MEDIDAS DE RUIDO REALIZADAS CON PRAAT EN MUJERES Y HOMBRES NORMALES SEGN GRADO DE SEVERIDAD DE LAS
PATOLOGAS

Mujeres Hombres
PRAAT Fuente n Rango r n Rango

N 98 .99 0 .96 1 .838 98 .99 .01 .92 1


AC LM 155 .99 .01 .91 1 .71 64 .96 .06 .73 1

INTERDISCIPLINARIA, 2012, 29, 2, 339-357


MS 78 .96 .06 .67 1 .923 66 .89 .13 .56 .99
Anlisis acstico de la voz normal y patolgica

N 98 .01 0 0 .04 .823 98 .01 .01 0 .09


NHR LM 155 .01 .01 0 .10 .648 64 .05 .08 0 .48
MS 78 .06 .11 0 .65 .904 66 .16 .24 .01 .84

N 98 24.35 2.33 15.12 29.04 .879 98 22.07 3.28 12.63 29.86


HNR LM 155 22.03 3.59 11.25 31.78 .912 64 18.26 5.16 5.38 27.14
MS 78 16.54 4.52 3.94 23.81 .951 66 13.12 6.08 1.06 22.82

Notacin
N: normal
LM: leve-moderada
MS: moderada-severa

355
Elisei

REFERENCIAS BIBLIOGRFICAS Fernndez, R., Damborenea, D., Rueda, P., Garca,


E., Leache, J., Campos, M.A. et al. (1999).
Baken, R.J. & Orlikoff, R. (2000). Clinical Anlisis acstico de la voz normal en adultos
measurement of speech and voice (2da. ed.). no fumadores [Acoustic analysis of normal
San Diego, USA: Singular Publising Group. voice in nonsmoking adults]. Acta Otorrino-
doi: 10.3109/14417040008996786. laringolgica Espaola - Sociedad Espaola
Bielamowicz, S., Kreiman, J., Gerratt, B.R., Dauer, de Otorrinolaringologa, 50(2), 134-141.
M.S. & Berke, G.S. (1993). Comparison of Godino-Llorente, J.I., Osma-Ruiz, V., Saenz-
voice analysis systems for perturbation mea- Lechon, N., Cobeta-Marco, I., Gonzalez-
surements. Journal of Acoustical Society of Herranz, R. & Ramirez-Calvo, C. (2008).
America, 9(4), 2337. doi:10.1121/1.4062 76. Acoustic analysis of voice using WPCVox: A
Boersma, P. (2009). Should jitter be measured by comparative study with Multi Dimensional
peak picking or by waveform matching? Folia Voice Program. European Archives of Oto-
Phoniatrica et Logopaedica, 61, 305-308. doi: Rhino-Laryngology, 265(4), 465-476. doi:10.
10.1159/000245159. 1007/s00405-007-0467-x.
Burris, C. (2011). Acoustic analysis software: A Gurlekian, J. (1997). El laboratorio de audicin y
quantitative and qualitative comparison of four habla del LIS [Speech and auditory laboratory
systems. Tesis de Maestra no publicada. Uni- from LIS]. En M. Guirao (Ed.), Procesos sen-
versity of Wisconsin. Maddison, USA. soriales y cognitivos (pp. 55-81). Buenos Aires:
Damborenea, D., Fernndez, R., Llorente, E., Dunken.
Naya, M.J., Marn, C., Rueda, P. et al. (1999). Gurlekian, J.A. (2001). La percepcin auditiva
Efecto del consumo de tabaco en el anlisis [Auditory percepion]. En I. Bustos Sanchez
acstico de la voz [Smoking effects in voice (Ed.), La percepcin auditiva: Un enfoque
acoustic analysis]. Acta Otorrinolaringolgica transversal (pp. 51-90). Madrid: CEPE.
Espaola - Sociedad Espaola de Otorrinola- Horii, Y. (1979). Fundamental frequency pertur-
ringologa, 50(2), 448-452. bation observed in sustained phonation. Jour-
Deliysky, D.D. & Boersma, P. (1993). Accurate nal of Speech and Hearing Research, 22, 5-19.
short-term analysis of the fundamental fre- Lieberman, P. (1961). Perturbations in vocal pitch.
quency and the harmonics-to-noise ratio of a Journal of Acoustical Society of America, 33
sampled sound. Proceedings of the Institute of (5), 597-603. doi: 10.1121/1.1908736.
Phonetic Sciences, 17 (pp. 97-110). Pases Oguz, H., Kilic, M.A. & Safak, M.A. (2011).
Bajos: Universidad de Amsterdam. Comparison of results in two acoustic analysis
Dwire, A. & McCauley, R. (1995). Repeated mea- programs: PRAAT and MDVP. Turkish Jour-
sures of vocal fundamental frequency pertur- nal of Medical Sciences, 41(5), 835-841.
bations obtained using de Visi-Pitch. Journal Orlikoff, R. (1990). Heartbeat-related fundamental
of Voice, 9, 156-162. doi:10.1016/ S089219 frequency and amplotude variations in healthy
97(05)80249-8. young and elderly male voices. Journal of
Elisei, N.G. (2011). Evaluacin acstica y per- Voice, 4, 322-328. doi: 10.1016/S08921997
ceptual de la voz para la deteccin y carac- (05)80049-9.
terizacin de los desrdenes vocales [Acoustic Preciado, J.A. & Fernndez, S. (1998). El anlisis
and perceptual voice assessment for the detec- digital de la seal acstica en el diagnstico de
tion and characterization of vocal disorders]. la patologa vocal. Sensibilidad y especificidad
Tesis Doctoral no publicada, Universidad de de las medidas del shimmer y del jitter [The
Buenos Aires. Buenos Aires. digital analysis of the acoustic signal in the

356 INTERDISCIPLINARIA, 2012, 29, 2, 339-357


Anlisis acstico de la voz normal y patolgica

diagnosis of vocal pathology. Sensitivity and Vieira, M.N., McInnes, F.R. & Jack, M.A. (1996).
specificity of the measures of shimmer and Robust F0 and jitter estimation in pathological
jitter]. Acta Otorrinolaringolgica Espaola - voices. Fourth International Conference on
Sociedad Espaola de Otorrinolaringologa, Spoken Language ICSLP 96, 745-748. doi:10.
49(6), 475-481. 1121/1.1430686.
Preciado, J.A., Garca, R. & Infante, J.C. (1998). Vieira, M.N., McInnes, F.R. & Jack, M.A. (2002).
Anlisis multidimensional de la funcin vocal. On the influence of laryngeal pathologies on
Estudio de casos y controles [Multidimensional acoustic and electroglottoraphic jitter mea-
analysis of vocal function. Case-control study]. sures. Journal of Acoustical Society of Amer-
Acta Otorrinolaringolgica Espaola - Socie- ica, 111(2), 1045-1055.
dad Espaola de Otorrinolaringologa, 49(6), Walton, J. & Orlikoff, R. (1994). Speaker race
467-474. identification from acoustic cues in the vocal
Takahashi, H. & Koike, Y. (1975). Some percep- signal. Journal of Speech Hearing Research,
tual dimensions and acoustical correlates of 38, 738-745.
pathologic voices. Acta Oto-laryngologica.
Supplementum, 338, 1-24.

Laboratorio de Investigaciones Sensoriales (LIS)


Consejo Nacional de Investigaciones
Cientficas y Tcnicas (CONICET)
Ciudad Autnoma de Buenos Aires
Repblica Argentina

Fecha de recepcin: 21 de mayo de 2012


Fecha de aceptacin: 6 de agosto de 2012

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 357

Вам также может понравиться