Вы находитесь на странице: 1из 130

MỞ ĐẦU

1. LÍ DO CHỌN ĐỀ TÀI
Tiếng Việt là một ngôn ngữ thuộc loại hình đơn lập, trong đó mỗi âm
tiết là một đơn vị hoàn chỉnh độc lập, là đơn vị cuối cùng trong việc phân xuất
các đơn vị của lời nói, đồng thời âm tiết cũng là cơ sở để phân tích cấu trúc
kết hợp các âm vị.
Các âm vị trong tiếng Việt có ba loại: nguyên âm, phụ âm và thanh
điệu. Nguyên âm và phụ âm là những âm vị tuyến tính, chúng kết hợp với
nhau theo trật tự trước sau trong quá trình phát âm. Chúng là những âm vị có
thể phân tách ra thành từng đơn vị nhỏ hơn, nên còn gọi là những âm vị đoạn
tính. Trái với loại âm vị trên, thanh điệu là âm vị phi tuyến tính, bao trùm toàn
bộ âm tiết và gắn liền với âm tiết trong suốt quá trình phát âm. Thanh không
thể chiết ra khỏi âm tiết được, mà nhất thiết phải gắn với âm tiết, vì thế nên
thanh còn gọi là âm vị siêu đoạn tính.
Chính do vai trò của âm tiết như vậy nên từ lâu nhiều tác giả đã quan
tâm nghiên cứu đơn vị cơ bản này, đặc biệt là bằng phương pháp thực
nghiệm. Các công trình thực nghiệm đã được công bố nhiều hơn cả là nghiên
cứu về hệ thanh điệu và formant của nguyên âm đơn.
Có thể coi Lê Văn Lý là người đầu tiên nghiên cứu thực nghiệm về
thanh điệu. Những nghiên cứu thực nghiệm về thanh điệu tiếng Việt còn có
thể kể: Nguyễn Hàm Dương (1962); Han Mieko(1968), Hoàng Cao cương
(1982); Cao Xuân Hạo (1986), Vũ Kim Bảng (1984), Nguyễn Văn Lợi, Vũ
Thanh Phương, Andrea Phạm Hoa...
Những nghiên cứu thực nghiệm về formant tiếng Việt có thể kể:
Nguyễn Văn Ái (1973, 1974); Vũ Kim Bảng (2002).

1
Tuy nhiên, trong phạm vi âm tiết tiếng Việt, xét về các đặc trưng âm
học của nó, còn có một số vấn đề chưa được đề cập tới, đó là: mối quan hệ
hay vai trò của âm đầu và âm cuối đối với nguyên âm (formant) và thanh điệu
(âm vực và đường nét). Những kết quả nghiên cứu này có giá trị cả về mặt lí
thuyết cũng như ứng dụng thực tiễn.
Trong vòng 50 năm qua, công nghệ thông tin đã phát triển nhanh chóng
và mạnh mẽ. Trong xu hướng chung đó cùng với vai trò của mạng Internet và
thông tin di động viễn thông nói riêng, sự phát triển các hệ tự động nhận dạng
và tổng hợp tiếng nói như là một nhu cầu tất yếu. Trên thế giới đã có những
bộ phần mềm thương mại thuộc lĩnh vực này dành cho tiếng Anh như: IBM
Via Voice, Dragon Naturally Speaking, L&H Voice Xpress. Gần đây nhất,
hãng Microsoft đã công bố việc tích hợp VUI (Voice User Interface) thay cho
GUI (Graphic User Intreface) truyền thống vào phiên bản điều hành Windows
thế hệ mới.
Tại Việt Nam, nội dung nghiên cứu về nhận dạng tiếng Việt đã được đề
cập tới từ năm 1981. Bắt đầu từ năm 1991 cho đến nay, trong các chương
trình, đề tài về khoa học và công nghệ, vấn đề nhận dạng và tổng hợp tiếng
Việt luôn là một nội dung được ưu tiên. Gần đây, nhiều đề tài các cấp về
nghiên cứu phát triển công nghệ nhận dạng và tổng hợp và xử lí ngôn ngữ
tiếng Việt đã có những kết quả đột phá trong lĩnh vực này.
Trong giai đoạn hiện nay, vấn đề xử lí tiếng Việt cho tổng hợp và nhận
dạng là một nhu cầu cấp bách đòi hỏi có những nghiên cứu thực nghiệm cụ
thể về ngữ âm tiếng Việt.
Từ những tiền đề trên chúng tôi lựa chọn đề tài: Cấu trúc formant của
nguyên âm tiếng Việt trong kết hợp với âm tắc và thanh điệu (Trên cơ sở khảo
sát thực nghiệm) làm đề tài luận án.

2
2. TỔNG QUAN
2.1. Những nghiên cứu về formant của nguyên âm trên thế giới
Formant và cấu trúc formant của nguyên âm là một trong những lĩnh
vực nghiên cứu mang tính ứng dụng cao đã được thực hiện ở nhiều ngôn ngữ
trên thế giới. Theo hướng nghiên cứu này, người ta đã thu được nhiều thành
công và đã có kết quả nghiên cứu ứng dụng vào công nghệ xử lí tiếng nói:
phần mềm tổng hợp tiếng nói thực hiện bằng phương pháp tổng hợp formant
đã được tích hợp vào các tiện ích của điện thoại di động, hộp thư trả lời tự
động, xếp hàng tự động... Những tiến bộ và điều kiện kĩ thuật hiện nay, đặc
biệt là sự phát triển của công nghệ thông tin cho phép các nhà khoa học
nghiên cứu một cách toàn diện và có hệ thống đặc trưng âm học của các ngôn
ngữ nói chung và của nguyên âm nói riêng.
Vào thế kỉ thứ 19, các nhà khoa học đã nhận thấy vai trò của cộng
hưởng trong bộ máy phát âm, đặc biệt là cấu trúc formant của nguyên âm
trong việc tạo ra bộ máy phát âm nhân tạo, tiền đề cho những máy tổng hợp
lời nói và phần mềm tổng hợp có thể bắt chước giọng nói của con người trong
những năm sau này. Các nhà ngữ âm học và cả kĩ sư tin học trong lĩnh vực
công nghệ tiếng nói đã quan tâm đến ba khía cạnh của formant trong lời nói
tự nhiên: đặc điểm cấu trúc formant, đặc điểm địa phương (regional
characteristics), và đặc trưng cá nhân của người nói (subject characteristics).
Đặc điểm cấu trúc âm học của formant được nghiên cứu khảo sát sâu
và kĩ hơn ở nhiều ngôn ngữ khác nhau mà điển hình là tiếng Anh. Việc lập
bản đồ âm học các nguyên âm tiếng Anh đã thực hiện bằng cách dùng tần số
formant của các nguyên âm làm cơ sở. Việc lập bản đồ nguyên âm này được
tiến hành ngay sau khi xuất hiện máy phân tích phổ lời nói, do hai tác giả
Peterson và Barney tiến hành vào năm 1952, các tác giả đã phân tích một tập

3
hợp gồm 10 nguyên âm đơn của mỗi người nói trong tổng số 76 người gồm cả
nam, nữ và trẻ em [126, tr 175].
Các tác giả cũng chỉ ra rằng ở những người khác nhau có sự hiện thực
hoá về mặt ngữ âm rất khác nhau trong phát âm các nguyên âm của họ, nhưng
họ vẫn duy trì các đối lập hệ thống một cách bình thường. Vì vậy, hai người
phát âm có thể thay đổi về hình dáng khoảng cách nguyên âm, và các giá trị
formant đối với âm //, chẳng hạn, ở người này có thể gần với các giá trị
formant đối với âm // ở người kia; nhưng cả hai người đều sẽ thể hiện nét
khu biệt âm học thoả đáng giữa // và // trong hệ thống nguyên âm của họ.
Bên cạnh đó, những người khác nhau có trường độ riêng của bộ máy phát âm,
và những khác biệt này có ảnh hưởng cố hữu lên mô hình các giá trị formant
theo nhiều cách mà người phát âm cũng thực sự không thể kiểm soát nổi. Vì
thế không có một phân biệt tuyệt đối về mặt âm học giữa các nguyên âm cận
kề hoặc gần nhau đối với nhiều người khác nhau. Là người sử dụng ngôn ngữ
mọi người hầu như không gặp khó khăn gì trong việc giải quyết vấn đề này, vì
chúng ta có thể, chỉ cần một mẫu lời nói rất nhỏ của một người nói bình
thường đối với hệ thống nguyên âm của người đó. Nói cách khác, chúng ta có
thể điều chỉnh bản đồ này ở tất cả mọi người, nhưng vẫn có những vùng
chung nhất định phụ thuộc vào giới tính, tuổi tác cũng như giọng nói của từng
vùng phương ngữ [126, tr 178].
Khi nghiên cứu tần số của các formant phía trên, Peterson và Barney
(1952) đã tiến hành thu âm các nguyên âm tự nhiên ở các từ bắt đầu bằng /h/
và kết thúc bằng /d/ của nhiều người khác nhau (đàn ông, phụ nữ và trẻ em),
các tác giả đã phân tích cấu trúc formant của những nguyên âm này, và hình
thành nên những nghiên cứu thẩm nhận bằng cách dùng các bản ghi âm tương
tự. Từ phân tích của hai ông, rồi đến công trình của Shepard (1972) sau này,
đã chỉ ra rằng ở đâu có sự nhầm lẫn thẩm nhận thì ở đó chúng có liên quan

4
mật thiết với sự gần gũi âm học được xác định bằng ba formant thấp nhất. Tư
liệu của họ cũng cho thấy một mức thay đổi đáng kể giữa các nguyên âm
được coi là điển hình và sự gối lên nhau giữa các nguyên âm khác nhau. Các
tác giả đã chỉ ra sự thay đổi của rất nhiều nguyên âm khác nhau khi các
formant của chúng được dựng lên so sánh với nhau [126, tr 176].
Những tư liệu này đã hé mở một khía cạnh quan trọng trong hoạt động
tiếp nhận nguyên âm, đặc biệt là bản chất hệ thống của formant liên quan đến
các giá trị tuyệt đối của chúng. Họ đã lưu ý rằng có một sự đa dạng trong các
thuộc tính âm học của các nguyên âm ở trẻ em, phụ nữ và đàn ông nảy sinh từ
những khác biệt về độ dài của bộ máy phát âm, cũng như sự đa dạng do
những khác biệt giữa các cá thể ở bộ máy phát âm và thay đổi mang tính thói
quen của cơ quan phát âm. Kết quả là nhiều nhà nghiên cứu đã lập ra các
thuật toán nhằm chuẩn hoá nét biến thể của tư liệu, trên cơ sở sự khác biệt về
trường độ của bộ máy phát âm.
Thí nghiệm của Ladefoged và Maddieson chứng minh các tần số
formant xác định đặc trưng âm vị học của hệ thống nguyên âm. Bằng việc
dùng lời nói tổng hợp, họ đã chứng minh nếu một hệ thống nguyên âm trong
một câu bị dịch chuyển thì người nghe sẽ thẩm nhận sự di chuyển mang tính
hệ thống của nguyên âm vào trong đường giao âm học của một nguyên âm
khác xét về mặt âm vị học.
Ví dụ: nguyên âm của từ head (cái đầu) có thể bị làm cho nghe thành
nguyên âm của từ hid (trốn) nếu các tần số formant của tất cả các nguyên âm
khác bị hạ xuống. Dường như người nghe có thể tiếp nhận một cách bình
thường đối với một người nói ở một vài từ ban đầu mà họ nghe thấy [109, tr
74].
Bên cạnh những kết quả nghiên cứu cấu trúc formant của tiếng Anh cấu
trúc formant của các nguyên âm tiếng Thụy Điển cũng được nghiên cứu rất kĩ

5
lưỡng trong các công trình của G. Fant và các cộng sự (1959). Việc khảo sát
thực nghiệm được thực hiện với một nhóm 24 sinh viên nam tại Viện Kĩ thuật
Hoàng gia, những người từng tham gia một khóa học truyền thông, họ đọc
một danh sách các nguyên âm độc lập tiếng Thụy Điển bao gồm: /o, a, ă, e, i,
y, u, o/ với khoảng cách 1,5 giây giữa các âm. Tương ứng với bảng phiên âm
quốc tế IPA của các kí tự được phát âm là /u:, o:, a:, e:, y:, i:/. Tần số formant
được đo qua bộ lọc mẫu phổ tại một vị trí thời gian bằng 1/4 độ dài của
nguyên âm. Mục đích trong nghiên cứu của Fant là tập hợp một dữ liệu liên
quan đến tần số formant của nguyên âm tiếng Thụy Điển. Những nghiên cứu
của Fant (1959) nhằm phục vụ những ứng dụng của công ty điện thoại
Erricson từ năm 1946 đến 1948. Thời gian đầu những nguyên âm trong
nghiên cứu được thể hiện trong khoảng thời gian là 4 giây để thực hiện một
dải phân tích tần số. Những nghiên cứu bước đầu của Fant có những hạn chế
trong việc tạo ra giọng nói tổng hợp một cách đều đặn và giọng này được thể
hiện giống như tiếng hát hơn là lời nói. Trong nghiên cứu tiếp theo, dữ liệu
được bổ sung là giọng nói của trẻ em và phụ nữ, giới hạn của nghiên cứu hiện
tại chỉ gồm các nguyên âm dài [92, tr 1]. Ngoài ra, trong công trình “Stops in
CV”, Fant cũng đã mô tả ảnh hưởng của phụ âm tắc đến formant của nguyên
âm tiếng Thụy Điển ở trường độ và vùng tần số giữa phụ âm và nguyên âm.
Năm 1998, Manjari Ohala và John J. Ohala đã tiến hành khảo sát sự
tương quan giữa các chuyển tiếp (formant) trong cấu trúc VC phụ âm tính
(trong đó V là các nguyên âm /a i u/ còn C là các phụ âm /p t  t k/) với
mức độ lẫn lộn của thính giác về đối lập vị trí trong tiếng Hindi. Bằng thủ
pháp thử và sai, tác giả đã đánh giá vai trò của các chuyển tiếp formant VC
độc lập với sự giải phóng âm tắc [124, tr1].
Năm 1999, James J.Hant và Abeer Alwan đã nghiên cứu và lập mô hình
cho chuyển tiếp formant trong bối cảnh nhiễu. Đánh giá cao vai trò quyết định

6
của chuyển tiếp formant trong việc nhận ra vị trí cấu âm của các phụ âm, các
tác giả đã đưa ra giả định nếu chuyển tiếp formant này “nhúng” vào trong một
môi trường nhiễu, và tiến hành xác định ngưỡng của các trượt lướt thanh điệu
(tone glides) và đường formant cá thể ở các tần số khác nhau, có trường độ
khác nhau. Kết quả nghiên cứu cho thấy ngưỡng là độc lập với mức tần số và
chỉ phụ thuộc vào trường độ và tần số trung tâm của chuyển tiếp [96, tr 1896].
Năm 1958, trong bài viết Effect of Third-Formant Transitions on
Perception of Voiced Stop Consonants đăng trên The Journal of Acoustical
Society of America, Vol. 30, No. 2, 122-126, tác giả dựa trên lời nói tổng hợp
(synthetic speech) đã tiến hành thực nghiệm và đi đến nhận xét “chuyển tiếp
formant thứ ba là chìa khóa cho việc thẩm nhận các âm /b d /”, “sự đa dạng
của chuyển tiếp formant thứ ba tương ứng cặp đôi với chuyển tiếp formant
thứ hai ở vị trí đầu trước nguyên âm /i/ và //”. Từ kết quả miêu tả về chuyển
tiếp và mức độ ổn định của formant thứ ba các tác giả đi đến nhận xét “sự tồn
tại của locus formant thứ ba tương tự với locus đã được tìm thấy trước đó đối
với formant thứ nhất và thứ hai” [103, tr 124].
Cũng năm 1958, P.C. Delattre, A. M. Liberman, F. S. Cooper qua khảo
sát âm xát tiếng Anh Mĩ, đã cho rằng chuyển tiếp formant là các tương liên
âm học của vị trí cấu âm. Tác giả cũng đã tổng kết những nghiên cứu đã có
trước đó và cho rằng có hai loại tín hiệu âm học để nhận ra vị trí cấu âm của
phụ âm: một là những đặc trưng bản thể, có ở âm tắc (stop) ,âm xát, và âm
tắc xát, là điểm mà tỉ lệ tần số của tiếng ồn hay tiếng rít được tạo ra tại điểm
rít, và hai là những chuyển tiếp hay biến đổi (sự thay đổi tần số tương đối
nhanh) của các formant thứ hai và thứ ba. Trong bài viết này, các tác giả cũng
khẳng định chuyển tiếp của formant thứ hai và thứ ba là những dấu hiệu nhận
dạng vị trí cấu âm của phụ âm theo hướng chuyển dịch tần số [87, tr 773].

7
Năm 1955, nhóm tác giả này trong bài viết "Acoustic Loci and
Transitional Cues for Consonants" cho rằng những nghiên cứu tổng hợp tiếng
nói trước đây đã mô tả sự quá độ của formant thứ hai là những tiêu điểm cho
nhận dạng các phụ âm tắc và mũi. Kết quả của những thí nghiệm này có thể
đơn giản hóa nếu nó giả định rằng: mỗi phụ âm có một nét đặc trưng và vị trí
tần số cố định, hoặc tiêu điểm cho formant thứ hai, tương ứng với vị trí cố
định của cơ chế tạo phụ âm. Trên nền tảng đó, những dấu hiệu quá độ có thể
được xem như "những sự biến động (sự vận động)" từ tiêu điểm tới trạng thái
bền vững của nguyên âm. Thí nghiệm trong bài viết này đã cung cấp thêm
một bằng chứng liên quan đến sự tồn tại và những vị trí là tiêu điểm của
formant thứ hai cho những phụ âm tắc hữu thanh /b, d, g/. Ở đó xuất hiện một
tiêu điểm cho /d/ tại 1800 cps và cho /b/ tại 720 cps. Một tiêu điểm cho /g/ có
thể được chứng minh chỉ khi nguyên âm bên cạnh có formant thứ hai của nó
trên khoảng 1200 cps. Đối với những phụ âm tắc hữu thanh, thời kì quá độ
không thể bắt đầu tại tiêu điểm và đi từ điểm đó đến vị trí cố định của nguyên
âm. Đúng hơn là, nếu chúng ta nghe phụ âm một cách thích hợp, phần đầu
của đoạn quá độ phải là khoảng lặng. Và nghiên cứu chỉ ra rằng, trong tổng
hợp lời nói phụ âm tắc hữu thanh được tổng hợp tốt nhất bằng cách tạo ra
trường độ thời gian giữa các khoảng lặng cân bằng với trường độ của chính
đoạn quá độ [88, tr 771].
Năm 1995, một nghiên cứu chuyển tiếp formant giữa âm tiết đầu có kết
thúc là nguyên âm và âm tiết thứ hai có nguyên âm là âm đầu trong chuỗi kết
hợp hai âm tiết trong tiếng Trung Quốc chuẩn cũng đã được nghiên cứu, (Yan
Jingzhu). Trong nghiên cứu này 661 chuỗi kết hợp âm tiết tiếng Trung trong
đó âm tiết đầu có kết thúc là nguyên âm và âm tiết thứ hai bắt đầu bằng một
nguyên âm (VV) được một người bản ngữ nam nói tiếng Bắc Kinh tạo ra, âm
thanh tiếng nói là chuỗi kết hợp âm tiết được phân tích bằng máy Kay và

8
Sonagraph 5500. Kết quả cho thấy một sự chuyển tiếp formant được hình
thành trong kết hợp âm tiết. Tần số formant có giá trị tại điểm bắt đầu của sự
chuyển tiếp cân bằng với formant của nguyên âm hạt nhân của âm tiết đầu
[97, tr 42].
Đặc điểm địa phương ở formant được quan tâm nghiên cứu trên
phương diện tìm các đặc trưng phương ngữ thể hiện trong cấu trúc của
formant. Theo hướng này, người ta mới chỉ quan tâm đến những khác biệt
vùng địa phương formant của một ngôn ngữ. Ví dụ bài viết "Tần số formant
của nguyên âm trong âm tiết /hVd/ trong lời nói của phụ nữ người miền Nam
Australia" của Andrew Butcher, năm 2006.Trong khoảng thời gian 5 năm
(2002 - 2006) các nguyên âm được ghi âm bởi các sinh viên năm thứ hai
chuyên ngành bệnh học lời nói tại trường đại học Flinder ở Adelaide. Trong
nghiên cứu này, dữ liệu chỉ bao gồm những phụ nữ trẻ, những người lớn lên ở
miền nam Australia (n = 92, độ tuổi trung bình là 22 tuổi), đa số họ được huấn
luyện. Trước khi phát âm danh sách các từ có cấu trúc /hVd/ được chuẩn bị
trước và ba dấu hiệu của mỗi nguyên âm là đọc từ những danh sách ngẫu
nhiên. (năm 2006, n = 22 ghi âm cộng thêm vào từ "Who'll (ai sẽ) " theo trật
tự tạo ra dấu hiệu của tha âm vị trước bên của /u/). Trong tất cả các trường
hợp lời nói được ghi âm trực tiếp trên ổ cứng máy vi tính trong môi trường
yên tĩnh, số hóa tại 22,5kHz, với độ phân giải 16 - bit. Tần số formant được
đo được từ sự hiển thị LPC, những điểm đo được xác định bằng sự liên quan
tới những dải phổ rộng, sử dụng chương trình SIL phân tích tiếng nói (phiên
bản thuộc 1.5 đến 2.7). Formant được đo ở giữa của sự phân chia đều đặn F1
lớn đối với nguyên âm mở và F1 nhỏ cho những nguyên âm đóng. Nguyên
âm đóng /i/ và /u/ trong trường hợp đặc biệt thường không đạt tới F1 nhỏ này
cho đến khi nguyên âm kết thúc hoàn toàn. Kết quả miêu tả giá trị trung bình

9
formant thu được cho tất cả các nguyên âm bao gồm cả nguyên âm đơn và
nguyên âm đôi của những người ở miền nam Australia [81, tr 450].
Đặc trưng cá nhân người nói thể hiện ở cấu trúc formant bao gồm giới
tính, độ tuổi và cả những người mắc các tật phát âm như nói lắp, nói ngọng
hay phẫu thuật thanh quản... Và mô hình chuyển tiếp formant đặc thù cá nhân
thể hiện trong một vài tổ hợp âm học. "Cấu trúc formant của nguyên âm được
tạo ra bởi những người có tật nói lắp với tốc độ nói nhanh và bình thường".
Trong nghiên cứu này tác giả Martine Toda, Shinji Maeda, Micheal Aron, và
Marie-Odile Berger đã phân tích phần cố định của hai formant F1 và F2 trong
cấu trúc CV, chứa nguyên âm /a, i, u/ được phát âm với hai tốc độ nhanh và
bình thường, bởi hai nhóm: được điều trị tật nói lắp và không được điều trị tật
nói lắp. Quỹ tích bằng nhau được tính toán để quan sát những khả năng khác
nhau trong đồng cấu âm giữa ba nhóm. Dữ liệu phân tích bộc lộ sự giảm bớt
khoảng cách của nguyên âm cho những người mắc tật nói lắp trong lời nói
bình thường. Khi tốc độ lời nói tăng lên, dễ nhận thấy khoảng cách nguyên
âm không hề giảm đối với những nhóm người nói sau, tương phản với cách
xem xét những người nói lắp với tốc độ nhanh [134, tr 357].
2.2. Những nghiên cứu về formant của nguyên âm tiếng Việt
Nghiên cứu formant của nguyên âm tiếng Việt đã được một tác giả
người nước ngoài là Han Mieko (1968) đề cập đến khi thực hiện một loạt
nghiên cứu âm vị học các ngôn ngữ châu Á. Cụ thể, trong công trình "Studies
in phonology of Asian Languages: Vietnamese Vowel" 11 nguyên âm đơn
tiếng Hà Nội đã được nghiên cứu và mô tả. F1 và F2 của 11 nguyên âm được
đo, phân tích, cuối cùng tác giả đi đến kết luận rằng có sự chi phối ảnh hưởng
bởi các yếu tố khác là thanh tính và phụ âm tính đến chất lượng của nguyên
âm. Khi thực hiện một nghiên cứu về trường độ cố hữu của 11 nguyên âm đơn
tiếng Việt, kết quả nghiên cứu của Han Mieko cho thấy có sự ảnh hưởng của

10
thanh điệu đối với các cấu trúc formant của nguyên âm. Theo bà thanh 6 làm
thay đổi vị trí F1 của nguyên âm, nó ảnh hưởng mạnh nhất đến các nguyên
âm có độ mở hẹp và trung bình và ảnh yếu đến các nguyên âm có độ mở rộng.
Thanh này hầu như không ảnh hưởng đến F2 [98, tr 92].
Khi nghiên cứu số lượng formant của nguyên âm tiếng Việt, Nguyễn
Văn Ái (1974) đã phân tích 11 nguyên âm đơn tiếng Việt ở vị trí mạnh
(nguyên âm đứng riêng thành âm tiết) và ở vị trí yếu (nguyên âm nằm trong
kết hợp âm tố, nhằm để phân tích hai nguyên âm ngắn ă, â là hai nguyên âm
không bao giờ xuất hiện riêng thành âm tiết) bằng máy xônagorap đã ghi
được khoảng 1300 đơn vị âm tiết do ba người phát âm (1 nữ, 2 nam). Kết quả
thực nghiệm cho thấy: số lượng formant của mỗi nguyên âm không giống
nhau hoàn toàn. Ở nguyên âm u, thường xuất hiện từ một đến hai formant; đôi
khi có formant thứ ba nhưng cường độ rất yếu. Những nguyên âm khác có số
lượng formant tương đối cố định: /i, e, , , , o, / đều có bốn formant,
riêng /o/, trong một số biến thể phát âm cá nhân, chỉ xuất hiện hai formant;
ở /e, a, ă/, xuất hiện năm formant, riêng /ă/ có khi chỉ có 4 formant. Phần lớn
những formant thứ 4, thứ 5 này có cường độ rất yếu. Tác giả kết luận các
nguyên âm đơn tiếng Việt có từ 2 đến 5 formant. [2]
Trước đó, năm 1973 trong bài viết công bố trên tạp chí Ngôn ngữ,
Nguyễn Văn Ái khi nghiên cứu thực nghiệm về mặt vật lí, với việc phân tích
400 ảnh sóng âm của 9 nguyên âm đơn tiếng Việt được lấy từ 10 CTV. Tác
giả đi đến kết luận: Ngoài đặc điểm cấu âm đầu tiên chung của các nguyên
âm là sự sản sinh tiếng thanh cơ bản trong thanh quản ra, tất cả các nguyên
âm tiếng Việt đều được hình thành cuối cùng ở khoang miệng (không có sự
tham gia của khoang mũi, vì khi cấu âm, phần sau của ngạc mềm nâng lên
đóng chặt đường thông lên khoang mũi). Do đó, chính hiện tượng cấu âm ở
khoang miệng: độ mở của miệng, góc độ của hàm và vị trí của lưỡi là nguyên

11
nhân trực tiếp có tính chất quyết định đến hiệu quả âm học của từng nguyên
âm. Trong nghiên cứu này, tác giả đã đưa ra vùng tần số F1 và F2 của từng
nguyên âm tiếng Việt như sau:
Nguyên âm F1 F2
i 250 - 420 Hz 2380 - 3360 Hz
ê 354 - 595 Hz 2000 - 2830 Hz
e 595 - 840 Hz 1630 - 2380 Hz
ư 250 - 420 Hz 840 - 1190 Hz
ơ 354 - 595 Hz 1000 - 1190 Hz
a 707 - 1000 Hz 1190 - 1410 Hz
u 250 - 420 Hz 595 - 840 Hz
ô 354 - 595 Hz 707 - 1000 Hz
o 595 - 707 Hz 840 - 1000 Hz

Kết quả thực nghiệm của các nguyên âm tiếng Việt cho thấy, những F1
của các nguyên âm dòng trước, dòng giữa và dòng sau có cùng độ nâng lưỡi
thường nằm trong vùng tần số formant giống nhau hoặc gần giống nhau. Ví
dụ: /i, , u/, /e, , o/, và /, / có thể thay thế nhau được ở vùng tần số F1 này.
Vậy những tiêu chí khu biệt các nguyên âm cùng nhóm trên là ở những F2 có
vùng tần số lớn hơn các F1.
Nguyên âm dòng trước /i, e, / có vùng tần số F1 và vùng tần số F2
nằm cách xa nhau; u, o,  là những nguyên âm dòng sau, bản thân chúng có
vùng tần số F1 và F2 cách nhau trung bình. Các nguyên âm tiếng Việt nằm
trong khoảng tần số 250 -3800Hz [1].
Hoàng Cao Cương (1986) [13] khi phân tích các sonagram đã nhận
thấy ở các âm tiết có chứa các thanh điệu 1, 3, 5, F2 của nguyên âm thường
được thể hiện rõ hơn, trong khi đó các âm tiết chứa các thanh còn lại thể hiện
F1 rõ hơn. Về dạng của formant, trong mọi trường hợp các F1 đều bằng
phẳng, trong khi F2 của các âm tiết chứa các thanh 3, 5 lại có dạng đi lên. Tác
giả cho rằng nếu quan niệm F2 là đặc trưng quan trọng của nguyên âm thì dễ

12
nhận thấy trong hệ thanh điệu Việt chỉ có thanh 1 là giúp cho dễ nhận diện các
chiết đoạn. Các thanh 4 và 6 làm cho người ta khó nhận diện các đoạn nằm ở
vị trí chung âm. Các thanh 3 và 5 có những ảnh hưởng nhất định đối với F2.
Ngoài ra khi nghiên cứu sự ảnh hưởng của phụ âm tới nguyên âm, tác
giả nhận thấy đặc trưng chuyển tiếp giữa C1 tới V và từ V tới C2 rất khác
nhau. Trong khi các chuyển tiếp C1V thường dễ dàng được thẩm nhận vì kích
thước lớn (giảm hoặc tăng cường độ từ 3-5dB, trường độ ít nhất là 15ms) thì
các chuyển tiếp VC2 thường thể hiện mờ nhạt (dao động và biến thái cường
độ không vượt quá 2dB, trường độ không vượt quá 10ms). Trong khi các dạng
chuyển tiếp C1V thường ổn định, phụ thuộc chặt chẽ vào các đặc trưng cố
hữu của C1 thì chuyển tiếp VC2 thường chỉ phụ thuộc vào đặc trưng cố hữu
của V và thanh điệu mà âm tiết chuyển tải. Các dạng chuyển tiếp của C1V
trong âm tiết kiểu Việt là bị nổi bật lên, trong khi chuyển tiếp VC2 bị hòa kết,
làm liền lại các chiết đoạn vốn dĩ có các đặc trưng cố hữu khác biệt nhau. Nếu
coi đặc trưng về tính tách biệt như là một biểu hiện quan trọng nhất của các
yếu tố âm thanh chiết đoạn thì có thể kết luận là C1 bảo lưu được nhiều đặc
trưng cố hữu của chúng hơn C2 khi cả hai đều tham gia vào cấu trúc âm tiết.
Xét từ quan điểm chiết đoạn, C1 là đồng chất hơn C2.
Một tình trạng tương tự xảy ra trong khu vực các âm thanh vốn được
coi là siêu đoạn của tiếng Việt. Nếu coi rằng điệu tính là nét ngữ âm (hoặc)
chùm nét ngữ âm hành chức bao trùm lên một chỉnh thể lớn hơn một chiết
đoạn và sự thể hiện nó là có tính quy luật theo đặc điểm tuyến tính của cấu
trúc chỉnh thể ấy (được phân bố theo thời gian), thì trong số thanh Việt chỉ có
thanh 1 là thanh vị đủ tư cách một đơn vị thuần điệu tính. Sự hoạt động của
thanh này không làm cho cấu trúc mà nó bao trùm lên bị phá vỡ các đặc điểm
cố hữu, không lấy các vùng chiết đoạn dễ cảm ứng với sự phá vỡ cấu trúc làm
nơi thể hiện các điểm đặc biệt của mình. Và cái quan trọng, sự thể hiện của nó

13
bao trùm lên toàn bộ âm tiết tới mức không để lộ ra các đặc điểm tuyến tính
của các chiết đoạn thành phần ở cái chỉnh thể mà nó phủ lên. Những thanh 3,
6, 5', 6' tạo thành một nhóm thanh vị khác, ở đó sự thể hiện thanh bị chi phối
bởi cấu trúc chiết đoạn. Chúng đều phải lấy phần cuối của cấu trúc chiết đoạn
làm nơi thể hiện các đặc thù của mình. Phần dễ cảm ứng với các thay đổi về
phân bố năng lượng (các đoạn transient) của cấu trúc chiết đoạn cũng là khu
vực gánh lấy thông tin cần yếu của thanh. Đoản độ của C2 cùng sự phá vỡ
cấu trúc chùm nét khu biệt của các chiết đoạn nằm trong khoảng đo 75 -100
Hz chính là biểu hiện của xu thế này. Những biểu hiện này đạt đến mức cực
đoan ở các thanh 5' và 6'. Ở các âm tiết có chứa hai thanh này, C2 bị biến mất
và để nhận diện ra chúng, người bản ngữ phải tận dụng các đặc thù locus bộc
lộ ở cuối cấu trúc chính âm. Tuy nhiên, do chỗ các bộ phận nằm ở cuối các
âm tiết có chứa thanh thường nghèo nàn về các đặc trưng cố hữu cho nên sự
nhận diện những bộ phận này thường gặp nhiều khó khăn trong thực tế.
Năm 2002, những kết quả nghiên cứu về hệ formant của 9 nguyên âm
đơn tiếng Hà Nội đọc tách rời đã được tác giả Vũ Kim Bảng trình bày trong
giới hạn phạm vi nghiên cứu là các CTV người Hà Nội và kết quả nghiên cứu
được tính theo giới tính. Việc trình bày giá trị khách quan của formant tính
bằng Hz trong mối tương quan với giá trị cảm nhận tính bằng đơn vị Bark cho
phép đưa ra các nhận xét về sự phân bố của hệ thống nguyên âm đơn tiếng Hà
Nội. Đây chính là cơ sở để tiếp tục thực hiện nghiên cứu các formant này trong
chuỗi lời nói liên tục cũng như các nguyên âm có sự tác động của thanh điệu.
Các đặc trưng âm học khác của tiếng Việt được nghiên cứu theo trình tự âm tố
(nguyên âm, phụ âm), âm tiết bao gồm cả thanh điệu và chuỗi lời nói góp phần
làm sáng tỏ đặc điểm đơn lập của tiếng Việt [6].

14
3. MỤC ĐÍCH NGHIÊN CỨU
Dựa vào việc mô tả cấu trúc formant của các nguyên âm đơn trong kết
hợp với thanh điệu và âm tắc ở các vị trí khác nhau trong âm tiết, mục đích
chính của luận án là: cung cấp các thông số âm học quan trọng cho quá trình
tổng hợp tiếng Việt, nhận dạng giọng nói tiếng Việt.
4. NHIỆM VỤ NGHIÊN CỨU
Để đạt được mục đích trên, luận án có các nhiệm vụ cụ thể sau:
- Tổng quan tình hình nghiên cứu cấu trúc formant của nguyên âm ở
nước ngoài và ở Việt Nam nhằm xác định rõ hướng nghiên cứu của đề tài.
- Xây dựng cơ sở lí thuyết cho đề tài trên cơ sở định rõ khái niệm cấu
trúc formant của nguyên âm và những vấn đề liên quan.
- Tìm các đặc điểm âm học liên quan đến formant của nguyên âm
trong quan hệ với thanh điệu và phụ âm tắc, phụ âm mũi; đồng thời xác định
sự tác động qua lại của yếu tố như phụ âm (phụ âm tắc, phụ âm mũi) và thanh
điệu đến formant của nguyên âm trên ba phương diện: trường độ formant,
vùng tần số formant và diễn tiến formant.
- Luận án sẽ chỉ ra các đặc điểm âm học của mối quan hệ giữa phụ âm
và nguyên âm, giữa thanh điệu và nguyên âm.
- Phân tích và mô tả đặc điểm liên cấu âm giữa thanh điệu và nguyên
âm.
- Phân tích và mô tả đặc điểm liên cấu âm giữa phụ âm đầu tắc và
nguyên âm.
- Phân tích và mô tả đặc điểm liên cấu âm giữa phụ âm cuối tắc và
nguyên âm.
- Trên cơ sở đó, rút ra những nhận xét chung về đặc điểm ngữ âm âm
học của mối quan hệ giữa thanh điệu và nguyên âm, giữa phụ âm và nguyên
âm có so sánh và thảo luận với kết quả nghiên cứu của một số tác giả khác.

15
5. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu của luận án là cấu trúc formant của các nguyên
âm đơn tiếng Việt trong bối cảnh kết hợp với thanh điệu và phụ âm tắc ở cả
hai vị trí mở đầu và kết thúc âm tiết.
Phạm vi nghiên cứu: Nghiên cứu chỉ giới hạn với cấu trúc formant của
9 nguyên âm đơn tiếng Việt với 6 phụ âm đầu tắc, mũi /m, n, , p, t, k/ và 6
phụ âm cuối tắc, mũi /m, n, p, t/ và /, k/.
6. PHƯƠNG PHÁP NGHIÊN CỨU
Để phục vụ cho việc mô tả cấu trúc formant của nguyên âm trong các
kết hợp, chúng tôi chủ yếu sử dụng hai phương pháp: phương pháp miêu tả và
ngữ âm học thực nghiệm. Ngoài ra, để chỉ rõ sự ảnh hưởng giữa thanh điệu
đến formant của nguyên âm, giữa phụ âm đầu và cuối đến formant so sánh
với formant nguyên âm ở trạng thái độc lập, một số thủ pháp thống kê và so
sánh cũng được sử dụng để trình bày, thể hiện và nhận xét các kết quả.
Để quan sát, miêu tả, phân tích các thông số âm học (các giá trị formant
(F1, F2) của nguyên âm) cũng như vẽ các biểu đồ, luận án đã sử dụng phần
mềm phân tích ngữ âm Praat.
Minh hoạ chương trình Praat và các cửa sổ của nó. Praat gồm màn hình
phía trên hiển thị dạng sóng của âm; màn hình dưới hiển thị các tham số:
1- Cửa sổ phía trên biểu thị dạng sóng của nguyên âm.
2 - Cửa sổ phía dưới biểu thị ảnh phổ trong đó có hiển thị đường nét
diễn tiến formant của nguyên âm. Ảnh phổ biểu thị vùng năng lượng của
formant là những khoảng tối sậm màu; vùng sậm màu ở dưới cùng biểu thị F1
của nguyên âm, những vùng sậm màu phía trên biểu thị vùng tần số F2.
Đường nét của formant của nguyên âm được hiển thị bằng những điểm liên
tục màu đen nhạt;

16
3- Cửa sổ nhỏ phía trên bên phải hiển thị các giá trị formant của nguyên
âm trên từng điểm đo.
Trục tung bên trái là thang đo và các mức tần số Hertz (Hz), trục hoành
phía dưới là trường độ của âm được tính bằng mili giây (ms). Các khoảng đo
cách đều nhau 10 ms cho phép theo dõi sự diễn tiến của formant và sự biến
đổi của cường độ đo bằng decibel (dB) và ranh giới trường độ mỗi bộ phận
cấu thành âm tiết theo hàm thời gian.

Diễn tiến tần số F3


Diễn tiến tần số F1 Diễn tiến tần số F2
Giá trị tần số F1, F2, F3, F4 trên
từng điểm đo

Căn cứ vào Spectrogam này, chúng tôi phải xác định được hai thông số
âm học:
- Trường độ của phụ âm đầu tính bằng mili giây (ms) liên quan đến
phương thức và thanh tính của phụ âm đó.
- Trường độ formant của nguyên âm tính bằng mili giây (ms) liên
quan đến phương thức và vị trí cấu âm của nguyên âm.

17
- Diễn tiến của formant tính bằng Herz (Hz) theo thời gian (ms) trong
đó quan trọng nhất là diễn tiến ở giai đoạn chuyển tiếp của F1 và F2 kết
hợp với âm đầu và âm cuối. Đây là thông số âm học được quan tâm
nghiên cứu.
Để xác định được hai thông số trên, ở mỗi Spectrogam phải xác định hai
điểm quan trọng:
- Điểm bắt đầu của đỉnh chuyển tiếp tức là ranh giới giữa phụ âm đầu
và nguyên âm.
- Điểm kết thúc chuyển tiếp của các formant, thời điểm mà các
formant kết thúc quá trình đi lên hoặc đi xuống, bắt đầu diễn tiến đều đặn
như formant của âm tiết trong kết hợp thanh điệu không bị chi phối bởi
phụ âm đầu.
Chương trình Praat tính toán diễn tiến tần số của tất cả các formant (F1,
F2, F3, F4) của nguyên âm theo thời gian từ đầu đến cuối của một âm tiết.
Như vậy, khi đã xác định được hai điểm trên trong một Spectrogam, chúng tôi
có thể xác định được:
- Trường độ (ms) của phụ âm đầu và trường độ formant của nguyên
âm
- Diễn tiến vùng tần số (Hz) của các formant trong giai đoạn chuyển
tiếp và thời gian (ms) chuyển tiếp.
- Diễn tiến tần số (Hz) của các formant trong giai đoạn ổn định và
thời gian (ms) ổn định.
Kết quả đo trở thành nguồn tư liệu để vẽ các biểu đồ. Chúng tôi vẽ hai
loại biểu đồ:
- Biểu đồ thể hiện vùng tần số F1, F2 của các nguyên âm đơn của 6
CTV.

18
- Biểu đồ thể hiện trường độ formant của các nguyên âm trong các kết
hợp.
Tất cả các dữ liệu thông số âm học về trường độ (ms), vùng tần số
formant (Hz) của những CTV tiêu biểu, sau khi xử lí, được chuyển sang dạng
văn bản Excel. Dữ liệu được trình bày ở phụ lục.
Về ghi âm, chúng tôi lựa chọn 6 CTV là các phát thanh viên của Đài
tiếng nói Việt Nam, giọng Hà Nội, có độ tuổi từ 30 đến 40, được yêu cầu phát
âm theo bảng từ. Nguyên âm được chọn làm thực nghiệm ở đây là 9 nguyên
âm đơn dài, xuất hiện trong kết hợp với 6 thanh điệu, và kết hợp với phụ âm ở
các kiểu cấu trúc âm tiết khác nhau (CV, VC). Các kiểu cấu trúc âm tiết được
khảo sát trong luận án chỉ có nguyên âm và phụ âm mà chưa xét đến những
trường hợp có âm đệm đi kèm. Cụ thể về các kiểu cấu trúc âm tiết tiếng Việt
được khảo sát như sau:
+ Kiểu cấu trúc âm tiết 1 (V) bao gồm 9 nguyên âm đơn tiếng Việt kết
hợp với 6 thanh điệu: i, ì, ĩ, ỉ, í, ị ê, e, ư, ơ, a, u, ô, o,…
9 nguyên âm x 6 thanh điệu x 6 CTV = 324 mẫu
+ Kiểu cấu trúc âm tiết 2 (CV) bao gồm 3 âm đầu ở vị trí C là các phụ
âm /p, t, k/: ví dụ: pa, pi, pê, pe, ta, ti, tê, te, ca, ki, kê…
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 3 (CV) bao gồm 3 âm đầu ở vị trí C là các phụ
âm /m, n, ŋ/, ví dụ: ma, mi, mê, mư, ni, nê, nghi, nghê...
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 4 (VC) bao gồm 3 âm cuối ở vị trí C là các phụ
âm /m, n, ŋ/, ví dụ: am, im, êm, em, in, ên, en, inh, ang, eng...
3 phụ âm x 9 nguyên âm x 6 CTV = 162 mẫu
+ Kiểu cấu trúc âm tiết 5 (VC) bao gồm 3 âm cuối ở vị trí C là các phụ
âm /p, t, k/, ví dụ: át, ít, ết, ét, ứt...

19
3 phụ âm x 9 nguyên âm x 2 thanh điệu x 6 CTV = 324 mẫu
Tổng số các âm tiết khảo sát là 1134 mẫu.
Việc tiến hành thu âm được thực hiện trong phòng thu của Đài tiếng nói
Việt Nam với độ cách âm cao (mức độ ồn nhiễu  1dB), sử dụng microphone
(SHURE SM 58) với khoảng cách 5-10 cm. Ghi âm bằng phần mềm CoolEdit
Pro, tín hiệu ghi âm được số hóa 16 bit, Mono, tần số lấy mẫu 11025 Hz.
7. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Những kết quả nghiên cứu của luận án góp phần chỉ ra các đặc điểm
cấu trúc formant nguyên âm tiếng Việt trong quan hệ với các đơn vị chiết
đoạn và siêu đoạn. Trên cơ sở so sánh với một số tác giả khác nhằm chỉ ra các
nét đặc thù riêng của tiếng Việt được thể hiện ở các formant.
Những kết quả khảo sát của luận án là một tổng quan nghiên cứu về
formant của nguyên âm trong mối quan hệ với thanh điệu và âm tắc. Nó có
thể làm cơ sở và được tiếp tục nghiên cứu rộng hơn sang các phong cách nói
khác, ở những vùng phương ngữ khác nhau, các cá nhân ở nhóm tuổi khác
nhau, ứng dụng cho các mục đích tổng hợp, nhận dạng và giám định âm
thanh lời nói tiếng Việt.
Luận án sẽ đóng góp các kết quả khoa học mới:
- Nghiên cứu quy luật biến đổi cấu trúc formant của nguyên âm khi kết
hợp với thanh điệu và âm tắc mô tả trên ba phương diện: trường độ, vùng tần
số và diễn tiến vùng tần số.
- Mô hình hoá và đưa ra các tham số đặc trưng cho vùng quá độ giữa
formant và âm tắc, giữa formant và thanh điệu. Những nghiên cứu này tạo
tiền đề cho việc cải tiến, nâng cao chất lượng của các hệ tổng hợp âm thanh
tiếng nói, nhận dạng tiếng Việt.

20
8. BỐ CỤC CỦA LUẬN ÁN
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, và phụ lục luận án
được cấu trúc gồm 4 chương như sau:
Chương 1: Cơ sở lí thuyết
Trong chương này chúng tôi trình bày tổng quan về nghiên cứu formant
của nguyên âm của một số ngôn ngữ trên thế giới và tiếng Việt. Một số khái
niệm cơ sở lí thuyết liên quan đến formant của nguyên âm, đặc điểm cấu trúc
âm tiết tiếng Việt và mối quan hệ giữa các đơn vị chiết đoạn và siêu đoạn
trong tiếng Việt.
Chương 2: Mối quan hệ giữa formant của nguyên âm và thanh
điệu
Chương này trình bày mối quan hệ của thanh điệu đối với cấu trúc
formant của nguyên âm.
Chương 3: Formant của nguyên âm trong kết hợp với âm đầu tắc
và thanh điệu
Nội dung chương 3 mô tả sự ảnh hưởng của nhóm phụ âm đầu tắc vô
thanh /p, t, k/, nhóm phụ âm mũi /m, n, ŋ/ đến formant của các nguyên âm
trên các phương diện: vùng tần số, diễn tiến đường nét và trường độ.
Chương 4: Formant của nguyên âm trong kết hợp với âm cuối tắc
và thanh điệu
Nội dung chương 4 mô tả ảnh hưởng của nhóm phụ âm cuối tắc vô
thanh /p, t, k/ trong tương quan so sánh với nhóm phụ âm mũi /m, n, ŋ/ đến
formant của các nguyên âm trên các phương diện vùng tần số, diễn tiến
đường nét và trường độ.

21
CHƯƠNG 1: CƠ SỞ LÍ THUYẾT

Để có cơ sở cho việc phân tích và miêu tả cấu trúc formant của nguyên
âm tiếng Việt trong kết hợp với thanh điệu và các phụ âm ở các chương tiếp
theo, chương này luận án giới thiệu một số cơ sở lí thuyết có liên quan đến
nguyên âm và cấu trúc formant của nguyên âm.
1.1. Khái niệm formant của nguyên âm
Formant được định nghĩa bởi Gunnar Fant (1960) "những đỉnh quang
phổ của phổ âm thanh được gọi là các formant". Định nghĩa này được sử
dụng rộng rãi trong nghiên cứu ngữ âm học và các xử lí âm thanh trong công
nghệ [93]. Khái niệm này còn được Benade (1976) sử dụng với nghĩa tương
tự "formant là những đỉnh được quan sát trong sự bao phủ của phổ được gọi
là các formant".
Nhà vật lí học người Đức, Hermann, L (1989) đưa ra khái niệm
formant để chỉ sự gia tăng về cường độ âm thanh của một hay một nhóm tần
số do tần số hoạ âm có cùng tần số với khoang cộng hưởng tạo nên đặc trưng
của mỗi nguyên âm. Những nghiên cứu sau này của các nhà ngôn ngữ học
ngày càng làm hoàn thiện khái niệm này (Lindblom, B, 1986; Ladefoyed, P
và Maddieson, I, 1990). Han Mieko (1969) trong ""Studies in phonology of
Asian Languages: Vietnamese Vowel" đã định nghĩa: "Nguyên âm được mô tả
bởi khoang cộng hưởng tương đối lớn trong so sánh với phụ âm. Khoang
cộng hưởng này được mạnh thêm ở những vùng khác nhau theo khẩu hình
đặc trưng của bộ máy phát âm của âm thanh lời nói. Những vùng có cộng
hưởng tăng mạnh được gọi là các formant. Mỗi nguyên âm có một kiểu
formant đặc trưng, và thực nghiệm đã chứng tỏ rằng hai formant đầu tiên
mang hầu hết thông tin về phẩm chất của nguyên âm" [98, tr 11].

22
Có hai khoang cộng hưởng quan trọng nhất được ngăn cách và thay đổi
do sự chuyển động của lưỡi tạo nên hai formant cơ bản của một nguyên âm:
F1: ứng với cộng hưởng vùng họng.
F2: ứng với cộng hưởng khoang miệng.
Khi ta nói, các âm mũi sẽ có sự xuất hiện của formant F3, các formant
khác F4, F5… liên quan đến các đặc trưng giọng nói riêng của mỗi cá nhân.
Mỗi lần môi, lưỡi, hàm ở những vị trí khác nhau là một lần hộp cộng hưởng
miệng và yết hầu thay đổi hình dáng, thể tích, lối thoát của không khí làm
biến đổi âm sắc của âm thanh đi qua chúng. Chính vì vậy, hai khoang miệng
và họng là hai hộp cộng hưởng quan trọng nhất, chúng tạo nên hai formant
chính F1 và F2 đặc trưng của mỗi nguyên âm.

Hình 1.1: Đỉnh formant của nguyên âm /ee, uh, ah/ trong tiếng Anh (theo
Ladefoged)
Hiện nay, nhờ sự phát triển của các phần mềm tin học, người ta có thể
đo được chính xác tần số formant, số lượng formant của nguyên âm tương
ứng với vị trí cấu âm khác nhau.

23
1.2. Cấu tạo bộ máy phát âm của con người
Các cơ quan cấu âm được miêu tả dưới đây bao gồm có phổi, khí quản,
thanh hầu, các khoang họng, khoang miệng cùng với các bộ phận cấu thành
của chúng tạo thành một nhóm được gọi bằng thuật ngữ là bộ máy phát âm
(vocal tract). Vì các lí do miêu tả và chức năng hoạt động mà bộ máy phát âm
thường được chia ra thành hai phần, một phần nằm ở phía trên thanh hầu, và
một phần nằm ở phía dưới thanh hầu. Nằm trong thanh hầu là các dây thanh:
kẽ hở giữa các dây thanh được gọi là khe thanh (glottis), và bộ máy phát âm
phía trên khe thanh vì thế được gọi là bộ máy phát âm phía trên thanh hầu
(supraglottal), còn ở phía dưới nó là bộ máy phát âm phía dưới thanh hầu
(subglottal). Việc lựa chọn điểm phân chia này được dựa vào sự phân biệt có
tính chức năng. Hệ hô hấp ở phía dưới khe thanh cung cấp nguồn năng lượng
chính cho việc tạo ra các âm thanh lời nói, trong khi đó bộ máy phát âm phía
trên khe thanh xác định chất lượng ngữ âm của các âm thanh lời nói. Các
công trình mô tả ngữ âm về âm thanh lời nói chủ yếu quan tâm đến hoạt động
phía trên thanh hầu.
Phổi (Lung): là một bộ phận gồm có vô số những bọng hơi nước rất
nhỏ có đường kính từ 0,1 đến 0,3mm, xung quanh có một màng lưới vi ti
huyết quản. Mỗi bọng hơi kết thúc một chi nhánh rất nhỏ của các nhánh phổi,
từ hai nhánh phổi chia ra như cành cây. Hai nhánh phổi hợp nhau lại ở gốc khí
quản. Nhánh phổi có một bộ cơ nhẵn cho phép nó co bóp.
Khí quản (Trachea): là một cái ống do những miếng xương sụn hình
bán nguyệt ép sát vào nhau làm thành.
Thanh Hầu (Larynx): được cấu tạo bởi một loạt xương sụn nối liền với
nhau bằng những cơ thịt và gân. Ở phía dưới thanh hầu có xương sụn hình
nhẫn gắn vào khâu trên cùng của khí quản khít cả bốn phía. Xương sụn này

24
trông như một chiếc nhẫn, phần hẹp ở phía sau, phần rộng (mặt nhẫn) quay về
phía trước.
Phía trên xương sụn hình nhẫn là xương sụn hình giáp, gồm có hai
mảng hình tứ giác không đều gắn chặt với nhau ở phía trước làm thành một
góc 900 ở nam giới và 1200 ở phụ nữ. Ở nam giới phần trên của góc này lồi ra
thành "cuống họng" hay còn gọi là "quả táo của Ađam".
ngạc cứng
lợi
khoang miệng
khoang mũi
mạc
cứng

môi lưỡi yết hầu

răng

thực quản
nắp thanh quản

dây thanh

Hình 1.2: Hình ảnh minh họa các cơ quan cấu âm của con người
(nguồn: Courtesy of Mike Gasser/Indiana University)
Dây thanh (Vocal Cord): gồm hai sợi ở cơ đàn hồi, hình nẹp có cấu
trúc niêm mạc. Một đầu dây thanh nối liền với sụn giáp cố định; một đầu kia
nối với sụn phễu. Nhờ các cơ mà sụn phễu có thể cử động linh hoạt làm cho
hai dây thanh có thể khép chặt để ngăn luồng hơi từ phổi đi ra hoặc mở ra
theo những dạng khác nhau. Ở trạng thái tĩnh dây thanh của đàn ông dài
khoảng 1,5 cm, của phụ nữ khoảng 1,2 cm. Dây thanh dày lên theo tuổi tác,
đặc biệt vào tuổi 14 -15, dây thanh dày lên rất nhanh, tạo nên hiện tượng gọi
là “vỡ giọng”.

25
sụn phễu

dây thanh khí quản

yết hầu

trước cổ
Khi phát âm Khi thở

Hình 1.3:Hình minh họa thanh quản, nhìn từ trên khi phát âm và khi thở
(http://www.phys.unsw.edu.au/jw/voice.html)
Khe thanh (Glottis) là khe hở giữa hai dây thanh khi chúng chuyển
động theo chiều ngang sang hai bên nhờ sụn phễu. Khi các cơ co lại, hai dây
thanh ngắn đi và độ căng của nó cũng thay đổi. Khác với dây thanh thật, trong
dây thanh giả không có cơ thịt, nó cấu tạo bằng vô số những lớp mô ngăn
cách nhau bằng nhưng tuyến nhờn nhỏ. Âm ban đầu được tạo ra ở hầu do sự
rung của hai dây thanh. Nguyên tắc tạo âm đó được gọi là lí thuyết cơ đàn hồi
(nyo- elastish) được đa số các nhà khoa học ủng hộ. Áp lực tăng lên đến mức
làm khe thanh hé mở, không khí thoát ra ngoài làm áp lực giảm xuống, dây
thanh lại trở về vị trí cũ. Cứ như vậy quá trình khép mở của hai dây thanh lặp
đi lặp lại. Do tính chất đàn hồi của dây thanh, âm ban đầu được phát ra nhờ sự
rung của dây thanh trong quá trình khép - mở. Dây thanh rung nhanh thì âm
phát ra cao, dây thanh rung chậm thì âm phát ra trầm.

26
Hình 1.4: Lát cắt dọc của khe thanh
Các cơ quan cấu âm: bao gồm môi, răng, lợi, ngạc cứng, ngạc mềm,
lưỡi con và họng, trong đó lưỡi đóng vai trò quan trọng nhất. Bản thân các cơ
quan này lại được phân thành cơ quan chủ động và cơ quan bị động.
Các cơ quan trên tự nó có thể trực tiếp tạo ra hiệu quả âm học nhờ sự
rung động của môi, lưỡi, lưỡi con….hoặc gián tiếp khi chúng nhích lại gần
nhau để tạo thành điểm tắc hay các khe sát.
Khoang cộng hưởng: bao gồm khoang hầu, khoang miệng và khoang
mũi, trong đó khoang hầu và khoang miệng có vai trò đặc biệt quan trọng.
Các khoang này có chức năng thay đổi (modification) âm ban đầu được hình
thành ở hầu để tạo nên sự khác biệt giữa các âm về chất. Chúng được gọi là
khoang cộng hưởng. Âm ban đầu là một tập hợp âm bao gồm một âm có tần
số thấp nhất (âm cơ bản) và các âm khác có tần số bằng bội số của âm cơ bản
(họa âm hay thượng âm). Mỗi khoang cấu âm có tần số riêng phụ thuộc vào
thể tích của chúng. Khi âm ban đầu được truyền ra ngoài, nếu họa âm nào có
tần số bằng tần số riêng của khoang cấu âm thì cường độ của nó được tăng

27
mạnh. Đó là hiện tượng cộng hưởng (Reronance). Các nguyên âm được hình
thành theo nguyên tắc này.
Chiều dài của khoang cộng hưởng chính là chiều dài của bộ máy phát âm
từ môi đến thanh môn. Tất nhiên bộ máy phát âm người có chiều dài không
giống nhau, nó sự khác nhau rõ rệt, phụ thuộc vào người đó là nam hay nữ,
vào sự trưởng thành về thể chất. Với những suy nghĩ như vậy, chúng ta có thể
xem bộ máy phát âm của người đàn ông điển hình có chiều dài là 17,6cm
(Fant 1960). Theo tư liệu của Pickett (1980), chiều dài bộ máy phát âm của nữ
bằng khoảng 80 - 90 % chiều dài bộ máy phát âm của nam, trong đó chiều dài
bộ máy phát âm của trẻ em phụ thuộc vào tuổi, có thể bằng khoảng 50% chiều
dài bộ máy phát âm của người lớn (nam).
Mỗi formant tương ứng với khoang cộng hưởng nhất định, các formant
phụ thuộc chặt chẽ vào hình dạng, kích thước của các khoang cộng hưởng. Do
đó, việc xác định giá trị các formant sẽ cho phép miêu tả được hình dáng, kích
thước của khoang cộng hưởng, tức là độ mở của miệng, vị trí của lưỡi, hình
dáng của môi.
Như đã biết, mỗi nguyên âm được quy định bởi hai (hoặc ba, bốn...)
formant ứng với hai hộp cộng hưởng chính là yết hầu và miệng. Khoang
miệng và khoang yết hầu tách biệt nhau do sự nâng cao của lưỡi. Chính vì
vậy, những thay đổi của khoang này đều kéo theo sự thay đổi của khoang kia.
Ta có thể đưa ra ví dụ về 3 nguyên âm /i, a, u/ trong tiếng Anh. Khi
phát âm nguyên âm trước như [i] hoặc nguyên âm sau như [u], lưỡi hoặc
nhích ra trước hoặc lùi về sau một cách cực đoan, làm cho hai khoang miệng
và khoang yết hầu chênh lệch hẳn nhau về thể tích, một rất hẹp và một rất
rộng và ngược lại. Chính vì thế một formant xuất hiện ở vùng tần số cao, một
formant xuất hiện ở vùng tần số thấp. Trái lại, khi phát âm nguyên âm [a],
lưỡi chia khoang miệng và khoang yết hầu thành hai khoang có thể tích gần

28
như cân bằng. Do đó, tạo nên những formant ở những vùng tần số gần nhau.
Điều này cho thấy giá trị của các formant đặc trưng cho vị trí và hình dạng
của khoang cộng hưởng. Khoang cộng hưởng càng nhỏ thì formant càng cao
và ngược lại, khoang cộng hưởng càng lớn thì formant càng thấp.

Hình 1.5: Hình ảnh mô tả các khoang cộng hưởng của nguyên âm [i, a, u]
Trên cơ sở đó, người ta có thể xây dựng lược đồ các nguyên âm căn cứ
vào tần số formant như sau:

Hình 1.6: Hình thang nguyên âm tiếng Anh căn cứ vào tần số formant
Như vậy, lược đồ các nguyên âm được xây dựng bằng những cứ liệu
âm học so với lược đồ được xây dựng trên những cứ liệu khảo sát sinh lý học

29
bộ máy phát âm trong khi phát âm các nguyên âm về cơ bản là thống nhất.
Đây chính là cơ sở của hình thang nguyên âm quốc tế.

Hình 1.7: Hình thang nguyên âm quốc tế (theo bảng mẫu tự phiên âm quốc tế
IPA 2005)
1.3. Những đặc trưng vật lý của âm thanh tiếng nói
1.3.1. Bản chất của âm
Nhìn từ quan điểm âm học thì các âm thanh ngôn ngữ cũng giống như
các âm thanh khác trong tự nhiên, vốn là những sự chấn động của các phân tử
không khí bắt nguồn từ sự chấn động của một vật thể đàn hồi hoặc từ sự chấn
động của luồng không khí chứa đựng trong một khoang rỗng. Khác với các
âm thanh khác, âm thanh của ngôn ngữ chỉ có thể là sự chấn động mà bộ máy
thính giác của con người có thể cảm thụ được. Những sự chấn động không
nghe được, gọi là siêu âm và âm ngoại, đều không phải là những âm thanh
của ngôn ngữ.
Bộ máy phát ra tiếng thanh của con người giống như một ống có lưỡi
gà. Ở chỗ miệng ống (nơi thổi không khí vào) có một miếng kim loại mỏng
và đàn hồi (lưỡi gà), gặp luồng không khí thổi vào thì chấn động và làm cho
không khí đựng trong ống chấn động theo.

30
1.3.2. Sóng âm
Sóng âm (Sound waves) là một dạng dao động phức tạp. Sóng âm được
tạo ra do sự chấn động của dây thanh. Khi luồng không khí bị ép ở phổi đạt
tới một áp suất đủ lớn, nó sẽ đẩy dây thanh bật tách ra khỏi nhau. Luồng
không khí được giải phóng, áp lực mất đi, thanh môn lại sập lại. Thanh môn
đóng làm cho không khí trong phổi không thoát ra được và áp suất lại tăng
lên, khi đủ mạnh sẽ đẩy dây thanh bật tách ra. Dây thanh liên tiếp đóng mở
như thế khiến luồng không khí từ phổi thoát ra ngoài thành từng đợt cách
nhau đều đặn, tạo thành sóng âm.
Sóng âm không có dạng hình sin đơn giản. Nó có thể tuần hoàn song
cũng có thể không tuần hoàn. Các nguyên âm có sóng tuần hoàn, âm được
thoát ra tự do (không bị cản trở). Người ta gọi đó là tiếng thanh để phân biệt
với tiếng động là đặc trưng của phụ âm (do âm phát ra bị cản trở tại các vị trí
cấu âm, sóng âm không tuần hoàn).

Hình 1.8: Dạng sóng tuần hoàn (nguyên âm[a]) và dạng sóng không tuần
hoàn (phụ âm[]) của tiếng Việt
1.3.3. Cao độ của âm thanh
Hai thuộc tính sinh âm nổi bật giữ vị trí quan trọng trong việc miêu tả
giọng nói: một là, cao độ là một chỉ tố xác định nổi bật nhất của sự nổi trội.
Nó thường được đo theo tỉ lệ, ví dụ, tần số dao động của thanh quản trong quá

31
trình sinh âm, có thể được đo trực tiếp từ dạng sóng lời nói; và hai là, cường
độ, như một yếu tố xác định chính của cường độ lời nói nói chung. Không thể
gộp các kiểu sinh âm (phonation modes) theo một cách hoàn toàn giống nhau,
bởi vì mặc dù chúng có thể được phân loại một cách dễ dàng về mặt thính
giác, nhưng chúng nằm trong mối quan hệ phức tạp hơn nhiều, gián tiếp hơn
và không nhất quán với các giá trị âm học khác nhau.
"Cao độ là đại lượng cảm thụ, tương quan với tần số của sóng âm;
trong lời nói, cao độ tương quan với tần số thanh cơ bản của dây thanh" (định
nghĩa của R. L. Trask trong Dictionary of Phonetics and Phonology, tr 278)
Cao độ thể hiện bằng vùng tần số cơ bản phản ánh những sự khác nhau
có tính chất sinh học về thanh quản, đặc biệt ở chiều dài và các cấu trúc cơ
của các khe thanh ở nam giới, nữ giới và trẻ em. Tần số càng lớn âm phát ra
càng cao. Một âm thanh có thể là tổ hợp của nhiều tần số, trong tiếng nói, tần
số cơ bản là đáp ứng của sự rung động các dây thanh âm, tần số cơ bản
thường được ký hiệu là F0. Tần số cơ bản phụ thuộc vào khối lượng và sự
căng của đôi dây thanh. Dây thanh của phụ nữ, trẻ em thường mảnh hơn và
căng hơn của đàn ông, người già do đó âm phát ra có tần số cao hơn. Có một
khoảng biến cá nhân khá rộng, tuy nhiên các vùng F0 chung đối với người nói
tiếng Anh là:
Người lớn nam 80 - 200 Hz
Người lớn nữ 150 - 300 Hz
Trẻ em 200 - 500 Hz
Các giá trị trung bình được tính bởi Peterson và Barney (1952) là
khoảng 130 Hz (nam), 220 Hz (nữ) và 270 Hz (trẻ em) [126, tr 183].
1.3.4. Cường độ âm thanh
"Cường độ - trị số chỉ năng lượng sóng âm đạt được, đo bằng decibel.
Cường độ tương quan với đại lượng về mặt cảm thụ là độ vang (loudness)"

32
(định nghĩa của R. L. Trask trong Dictionary of Phonetics and Phonology, tr
181)
Khi dao động trong quá trình truyền sóng, sóng âm tạo ra một áp lực
lên không khí. Để đo áp lực âm thanh, người ta dùng công thức:
P (áp lực) = F(lực) /A (diện tích)
Đơn vị của áp lực là Pascal (Pa) hoặc Newton trên diện tích 1 mét
vuông (N/m2). Nhưng áp lực âm thanh tác động vào tai người nghe chỉ là rất
nhỏ, do vậy người ta không sử dụng các đơn vị Pa hay N/m 2 mà lập ra một hệ
đo cường độ âm thanh tương ứng với áp lực âm thanh theo tỉ lệ logarit 1:10
được gọi là hệ đo Bel. Nguyên tắc của hệ này là: nếu áp lực tăng lên 10 lần so
với áp lực ban đầu thì giá trị của cường độ âm thanh tăng lên 1 Bel (tương tự:
áp lực tăng 100 lần bằng cường độ 2 Bel; 1000 lần bằng 3 Bel…). Trong thực
tế, người ta thường dùng đơn vị Decibel (1dB = 1/10 Bel).
Cường độ của âm thanh không ảnh hưởng đến những đặc điểm về
phẩm chất, tức về âm sắc của nguyên âm. Cường độ của nguyên âm tùy thuộc
trước hết vào mức độ to nhỏ của toàn câu nói, ngoài ra cũng tùy thuộc vào vị
trí của nguyên âm đối với trọng âm từ và trọng âm câu. Nếu trọng âm là trọng
âm lực thì nguyên âm có trọng âm sẽ mạnh hơn nguyên âm không có trọng
âm, và ngược lại. Ngoài ra, cường độ của nguyên âm còn gắn liền với phẩm
chất của nó; chẳng hạn các nguyên âm hẹp thường yếu hơn nguyên âm rộng.
Sự khác nhau về cường độ bao giờ cũng do những nhân tố bên ngoài nào đó
gây nên và bao giờ cũng lệ thuộc vào những nhân tố đó, cho nên nó không có
giá trị âm vị học được. Không có một ngôn ngữ nào mà trong đó một đôi âm
vị nguyên âm lại chỉ khu biệt với nhau về cường độ. Cường độ không phải
trước sau như một trong suốt thời gian phát âm nguyên âm, nhưng phần nhiều
sự thay đổi cường độ lệ thuộc vào những điều kiện nhất định (vị trí của
nguyên âm so với trọng âm, sự tiếp cận với các loại phụ âm khác nhau…).

33
Song cũng có những ngôn ngữ trong đó sự thay đổi về cường độ ở bên trong
nguyên âm có một tính chất độc lập.
Nghiên cứu cường độ là một công việc không đơn giản nhưng có thể
thực hiện bằng những phương pháp ngữ âm học thực nghiệm. Trên quan điểm
ngữ âm học chỉ cần khảo sát cường độ tương đối. Nghiên cứu cường độ tương
đối là xác định xem nguyên âm nào trong từ mạnh hơn nguyên âm nào yếu
hơn.
1.3.5. Trường độ âm thanh
Là độ dài của âm thanh hay nói cách khác là thời gian diễn ra dao động
sóng âm từ lúc bắt đầu đến khi kết thúc tạo nên sự tương phản giữa các bộ
phận của lời nói. Nó là yếu tố tạo nên sự đối lập giữa nguyên âm này với
nguyên âm khác trong một số ngôn ngữ. Đơn vị đo trường độ tính bằng mili
giây (1 ms = 1/1000s). Không có quy luật chung về trường độ tất yếu cho mọi
ngôn ngữ. Quy luật duy nhất có thể được xem là phổ biến đó là trường độ của
nguyên âm phụ thuộc vào nhịp điệu nói. Đối với mỗi ngôn ngữ trường độ
trung bình của một nguyên âm ở một vị trí nhất định là một đại lượng ít nhiều
cố định. Trường độ thường lệ thuộc vào những điều kiện ngữ âm học, hay nói
cách khác là phụ thuộc vào vị trí ngữ âm học. Trường độ trong âm tiết khép
và trong âm tiết mở nhiều khi khác nhau, nó cũng có thể phụ thuộc vào tính
chất của phụ âm đi sau (tắc, xát, hữu thanh, vô thanh), vào số lượng phụ âm đi
sau, vào vị trí của trọng âm và vào số âm tiết có trong từ. Ngoài ra, trường độ
của nguyên âm cũng lệ thuộc một phần vào phẩm chất của nó.
1.4. Đặc trưng cấu âm của nguyên âm và phụ âm
Để tạo ra một âm bất kì thì phải cần có một nguồn năng lượng nhất định
nào đó. Đối với lời nói, đó là luồng không khí để tạo sản các âm, còn thể tích
và áp suất của không khí sẽ quyết định trường độ (duration) và độ lớn
(loudness) của âm tạo ra. Đại đa số các âm thanh lời nói đều sử dụng luồng

34
không khí từ phổi phục vụ cho hoạt động này. Hệ thống hô hấp được xem là
nguồn năng lượng, còn phổi tạo thành hồ chứa khí. Các cánh phổi thường bị
nén bởi nhiều lực hô hấp khác nhau, và khi bị nén lại, không khí sẽ thổi ra, và
hoạt động này đều đặn có chu kì, hoặc siết, hoặc tắc hoàn toàn luồng không
khí này, và tất cả đều tạo ra ở trong chuỗi âm liên tục mà chúng ta xác định
với tư cách như là một chuỗi các âm lời nói.
Luồng không khí có thể bị gián đoạn một cách có chu kì bởi các dây
thanh, được định vị trên lối thoát không khí ở bên trên phổi và tạo thành một
bộ phận của cấu trúc nắp thanh quản. Khi luồng không khí từ phổi đi qua khí
quản bị chặn lại bởi hai dây thanh đóng, áp suất khí dưới chúng tăng lên. Áp
suất này nhanh chóng đẩy hai dây thanh tách ra. Khi không khí đi qua khe
thanh, áp suất khí cục bộ lúc đó giảm xuống và các dây thanh lại khép lại. Vì
vậy không khí được giải phóng thành các đợt ngắn có chu kì. Quá trình rung
động của khe thanh này, được gọi là sinh âm (phonation), giống như quá trình
tạo ra tiếng ồn khi bạn bơm một chiếc khinh khí cầu, kéo dài cổ ra thành một
kẽ hở hẹp, và cho không khí thoát ra. Các đợt hơi được tạo thành do sự rung
động của khe thanh diễn ra với một tần số hay tỉ lệ xác định. Tần số này có
thể thay đổi và được xác định bởi các lực cơ điều khiển độ căng của các dây
thanh và bởi áp suất không khí ở phía dưới dây thanh. Tần số này được tiếp
nhận là cao độ (pitch) của giọng nói. Các âm được tạo ra theo cách này, với
luồng không khí đi ra từ phổi đi qua các khe thanh đang rung động, bao gồm
tất cả các nguyên âm và các âm giống nguyên âm.
Ở các nguyên âm, các dây thanh rung động như đã mô tả, giải phóng một
chuỗi các đợt không khí ra ngoài. Ngạc mềm (mà trong trạng thái thở im lặng
bình thường thường rủ xuống cho phép luồng không khí tự do đi qua khoang
mũi và các lỗ mũi) được nâng lên, vì trong suốt quá trình nói nó thường ngăn
cản hoặc giảm luồng không khí đi vào khoang mũi. Luồng không khí vì thế đi

35
qua họng (khoang họng) và miệng (khoang miệng). Hình dáng, hay các thuộc
tính cộng hưởng của hai khoang này được điều khiển bởi vị trí của lưỡi, độ
mở của hàm, và hình dáng của đôi môi. Vì vậy, đối với [i:] trong từ heed lưỡi
sẽ đẩy về phía trước và được nâng lên đến khu vực ngay dưới ngạc cứng,
trong khi đó hai môi lại nhành ra. Đối với [a:] trong từ hard lưỡi lại ở tư thế
tương đối trung hoà hoặc hơi rụt lại phía sau một tí chút trên sàn miệng, hàm
mở hơn so với [i:], còn môi mở ra ở một tư thế trung hoà hoặc tự nhiên. Đối
với [:] trong từ hoard, lưỡi rụt lại, chỗ lưỡi phồng lên được nâng lên về phía
ngạc mềm, và hai môi tròn lại. Mỗi một trong số ba vị trí cấu âm này làm thay
đổi thể tích và hình dạng của các khoang họng và miệng, và mỗi vị trí đều có
các thuộc tính cộng hưởng đặc trưng riêng của mình. Âm được phát ra bởi các
đợt không khí từ các khe thanh rung động sẽ bị thay đổi bởi các thuộc tính
cộng hưởng này, với kết quả là mỗi một âm nguyên âm đều có một chất lượng
riêng. Mọi người có thể cảm thấy một cái gì thay đổi về cấu âm nếu muốn nói
một trong ba âm nguyên âm này trong khi đó tập trung để ý đến vị trí của
lưỡi, hàm và hai môi; cũng có thể thay đổi các hiệu ứng cộng hưởng của một
khoang bằng cách phát ra một nguyên âm [a:] trong khi khum hoặc không
khum tay xung quanh hai môi. Các nguyên âm và các âm giống nguyên âm
được tạo thành bằng cách thay đổi hình dạng của các khoang họng và miệng,
nhưng không có một sự tắc hoặc sự cản trở nào đối với luồng không khí. Bên
cạnh đó, kích cỡ và hình dáng của bộ máy phát âm có thể bị thay đổi, về cơ
bản hoạt động định vị của lưỡi và hai môi; khi bộ máy phát âm bị thay đổi thì
chất lượng âm tiếp nhận của các âm nguyên âm cũng bị thay đổi theo. Vì vậy,
hai hoạt động phát âm cơ bản nhất trong khi tạo ra các âm nguyên âm khác
nhau là hình dáng và vị trí của lưỡi xác định hình dáng khoang miệng và
khoang họng, còn hai môi điều khiển hình dáng và khu vực thuộc phía trước

36
của bộ máy phát âm. Sự chúm môi cũng cung cấp một phương tiện mở rộng
chiều dài chung của bộ máy phát âm.
Đặc trưng cấu âm của phụ âm được tạo ra do cơ chế luồng hơi từ hầu sử
dụng luồng hơi phía trên dây thanh. Dây thanh khép lại, và thanh quản bị di
chuyển lên trên và xuống dưới họng, dưới sự điều khiển của các cơ thanh
quản ngoài, để tạo ra luồng hơi. Vì dây thanh bị khép lại, cho nên không khí
phía dưới hầu không có liên quan và thanh quản hoạt động giống như một đầu
mút hay quả nén trong cái xi lanh. Nếu thanh quản di chuyển lên phía trên
theo cách này, nó có thể tạo ra luồng hơi thở ra từ họng; và khi di chuyển
xuống phía dưới, nó lại tạo ra một luồng hơi hít vào từ họng. Các âm thở ra từ
họng thường được biết đến là các âm bật, và đôi khi được gọi là “các âm tắc
thanh hầu hoá” (glottalized stops). Sự dịch chuyển lên phía trên của thanh
quản, với dây thanh khép lại, nén không khí ở phía trên lại và làm cho luồng
khí đi ra. Chúng ta có thể phát âm các âm như vậy bằng cách lấy hơi và cứ
giữ như thế, sau đó phát âm các âm [p, t, k] hoặc [s] mà không mở khe thanh,
chỉ dùng luồng hơi bị nén lại bằng cách nâng thanh quản lên.
Ngoài ra, các âm phụ âm còn được tạo ra bằng cách sử dụng các khả
năng cấu âm của lưỡi, răng và môi theo cách luồng không khí đi qua khoang
miệng sẽ bị siết lại một cách đột ngột hoặc tạm thời bị cản trở hoàn toàn.
Ví dụ, âm [b] của từ bạn, được coi là một âm tắc (stop), được phát ra như
tên gọi của nó nhằm chỉ sự tắc nghẽn có tính chất chuyển tiếp của luồng hơi. Ở
âm này, ngạc mềm được nâng lên để ngăn không cho không khí đi qua khoang
mũi, hai môi được khép lại trong một khoảng thời gian ngắn ngủi, và trong khi
khép, áp suất không khí tăng lên ở các khoang họng và miệng. Hai môi khi đó
được tách ra, giải phóng áp suất khí ở phía sau chúng và cho phép luồng không
khí bình thường đối với nguyên âm đi sau. Âm điển hình của hành động cấu
âm này phần lớn là do những thay đổi nhanh chóng ở các thuộc tính cộng

37
hưởng của khoang miệng trong suốt khoảng thời gian rất ngắn từ điểm mà hai
môi bắt đầu mở đến điểm khi hoạt động cấu âm nguyên âm bình thường đã bắt
đầu.
Các âm nguyên âm khác phụ thuộc vào sự cản trở đột ngột của luồng hơi
ở trong khoang miệng, chứ không phải là sự cản trở có tính chất chuyển tiếp.
Vì vậy [l] ở trong từ linh được tạo ra bằng cách giữ cho đầu lưỡi tì vào lợi
ngay sau răng trước và cho luồng hơi đi chệch về một bên hoặc cả hai bên
lưỡi. Những âm như thế được gọi là các âm bên. Hoạt động cấu âm này có
các thuộc tính cộng hưởng xác định rất riêng của mình tạo ra một chất lượng
nguyên âm đặc trưng.
Tất cả các âm được nhắc đến cho đến nay đều phụ thuộc vào luồng hơi
đi qua khoang họng và khoang miệng. Có thể làm cản trở khoang miệng, sao
cho không khí thổi qua khoang họng và khoang mũi, như ở âm [m] của từ ma.
Các phụ âm mũi kiểu như vậy được tạo ra với ngạc mềm hạ thấp xuống để
cho luồng hơi đi qua đường mũi, và với khoang miệng bị ngăn chặn trong
suốt khoảng thời gian phát âm phụ âm. Trong hoạt động này, khoang họng và
khoang mũi mở, khoang miệng đóng tất cả đều tham gia vào các thuộc tính
cộng hưởng của âm.
Tuy nhiên, có một cách khác tạo ra các âm phụ âm bằng cách đặt các cơ
quan cấu âm theo cách sao cho tạo ra một chỗ xát hoặc sự hỗn loạn. Ví dụ
đơn giản nhất về một phụ âm xát là [h] như trong từ họ. Ở âm xát này, sự hỗn
loạn xảy ra ở cả khi mở khe thanh và suốt trên đường thoát không khí và các
khoang mà không khí đi qua. Tuy nhiên, ở hầu hết các âm xát, âm được tạo ra
bởi sự hỗn loạn không khí tại một điểm xác định nào đó. Vì thế âm [v] trong
từ viên được tạo ra với môi dưới hơi tì vào mép hàm răng trước phía trên, sao
cho sự hỗn loạn xảy ra khi không khí bị đẩy ra.

38
Ở hầu hết các âm mà đã nhắc đến cho đến nay, sự rung động của các dây
thanh đều diễn ra liên tục trong suốt quá trình phát âm âm đó. Tất cả các âm
như vậy được gọi là hữu thanh. Nhưng một số âm là vô thanh; chúng đều sử
dụng các kiểu dáng cấu âm hoàn toàn giống như đã miêu tả đối với các âm hữu
thanh nhưng luồng hơi bị ngắt quãng, vì các dây thanh không rung động. Hiện
tại có nhiều đợt không khí không có chu kì hoạt động với tư cách như một
nguồn âm, và chỗ tắc hoặc chỗ ngắt ở một vị trí nào đó trong lối thoát không
khí và các khoang phía trên thanh quản trở thành nguồn âm. Ở một âm xát vô
thanh, chẳng hạn như âm [f] trong từ phố, sự hỗn loạn sinh ra khi môi dưới hơi
tì vào mép hàm răng trước phía trên là nguồn âm. Vì vậy, các âm xát có thể là
vô thanh hoặc hữu thanh, và âm [f] vô thanh là âm giống hệt với âm [v] hữu
thanh, vốn sử dụng cả rung động của khe thanh lẫn sự hỗn loạn được sinh ra do
tắc nghẽn cục bộ. So sánh các từ phố và vố, trong đó nét khu biệt chính là hữu
thanh, hay rung động dây thanh, trong suốt quá trình phát âm âm [v].
Các âm tắc cũng có tính chất vô thanh nếu rung động dây thanh không
bắt đầu cho đến khi bắt đầu sự giải phóng sự tắc nghẽn ở trong khoang miệng.
Nét khu biệt chính giữa các âm đầu ở trong các từ pin và bin, khi được phát
âm, là ở chỗ ở từ đầu, rung động dây thanh bắt đầu sau khi hai môi đã bắt đầu
tách ra, và ở từ sau, các khe thanh đã đang rung động khi hai môi tách ra.
Trong lời nói liên tục bình thường một số quá trình này diễn ra rất nhanh,
và kết quả là có thể kết hợp với nhau. Âm tạo ra có thể cho biết những thay
đổi chất lượng nhanh chóng, và khía cạnh động lực học lời nói này cũng quan
trọng trong việc cung cấp các dấu hiệu cho người nghe một chuỗi cố hữu các
âm lời nói.

39
1.5. Cấu trúc âm tiết tiếng Việt và mối quan hệ giữa các đơn vị
đoạn tính và siêu đoạn tính trong âm tiết
1.5.1. Cấu trúc âm tiết tiếng Việt
Cho đến nay, trong phân tích ngữ âm tiếng Việt, có ít nhất là ba quan
điểm khác nhau về cấu trúc nội tại của âm tiết. Sau đây là phác họa các mô
hình cấu trúc âm tiết:
1. Trong công trình nghiên cứu về tiếng Việt, Lê Văn Lý bàn về các
cách kết hợp của âm vị tiếng Việt thành những âm có ý nghĩa, tức là một âm
tiết. Và ông cho rằng có bốn loại âm tiết tiếng Việt như sau [73, tr 123]:
Chỉ có nguyên âm;
Nguyên âm + Phụ âm;
Phụ âm + Nguyên âm
Phụ âm + Nguyên âm + Phụ âm.
Mặc dù thừa nhận rằng mỗi âm tiết tiếng Việt chỉ có thể mang một
thanh (tr.126), tác giả vẫn cho rằng mỗi âm tiết tiếng Việt không thể có quá ba
âm vị vì ông cho rằng thanh chỉ là một yếu tố ngôn điệu như trong ngữ âm
tiếng Ấn Âu, và do vậy không phải là một âm vị gắn liền với âm tiết. Nói các
khác, âm tiết tiếng Việt theo như mô tả của Lê Văn Lý chỉ gồm ba âm vị
tuyến tính. Vì lẽ đó chúng tôi xếp quan điểm của ông vào quan điểm mô tả
theo cấu trúc CV hiểu theo nghĩa rằng quan điểm của tác giả là chỉ chú trọng
đến các yếu tố tuyến tính mà bỏ ra ngoài các yếu tố phi tuyến tính:
 Loại 1: V
 Loại 2: VC
 Loại 3: CV
 Loại 4: CVC
Nguyễn Bạt Tụy cũng bàn về âm tiết, mà ông gọi là "vần". Tác giả định
nghĩa "vần" là một hay nhiều âm cùng phát ra một hơi mà lập thành một tiếng

40
hay một phần tiếng. Ông cũng lưu ý độc giả rằng đừng nên lẫn với "vận" - là
sự trở lại của cùng một âm ở cuối hai hay nhiều câu thơ. Khi mô tả các dạng
kết hợp "vần", tác giả cho rằng "vần" tiếng Việt có ba loại lớn [74, tr 78-85].
1. vần chính là vần có toàn âm chính ghép thành;
2. vần bán là vần do âm chính và âm bán ghép thành;
3. vần phụ là vần do âm chính và âm phụ, hay âm chính, âm bán và
âm phụ ghép thành.
Tác giả có bàn về việc ghép thanh vào mỗi "vần", nhưng quan niệm của
ông không thật rõ ràng. Một đằng tác giả vẫn cho rằng thanh gắn liền với âm
chính, và ông cho các âm chính mang thanh khi ghép "vần"; mặt khác, khi
phân loại các "vần" thì ông lại chỉ nhắc đến ba thành phần âm vị là âm chính,
âm bán, âm phụ mà thôi, nghĩa là các âm vị tuyến tính -nếu nhìn từ quan điểm
ngữ âm học loại hình ngôn ngữ Ấn Âu.
Một tác giả khác cũng bàn về cấu trúc âm tiết tiếng Việt, là Emeneau
(1951). Ðáng chú ý là tác giả nhận ra là từ của tiếng Việt trong nhiều trường
hợp đã trùng khít với âm tiết. Và vì thế, từ có thể là một hạt nhân chủ yếu
gồm một trong nhóm của 11 nguyên âm, hay những kết hợp khác nhau của
hai hay ba âm vị của nhóm đó. Trước phần hạt nhân này có khi không có gì,
hoặc là có một trong 21 âm vị phụ âm. Sau phần hạt nhân có thể không có gì
(một số tổ hợp nguyên âm không cho thêm gì nữa cả), hoặc là có một trong 8
phụ âm mà trong đó có 7 tương tự với nhóm 21 phụ âm đầu.
Tác giả cũng nhắc đến vai trò của thanh điệu, và cũng nhận thấy là các
tổ hợp âm vị đều có một trong 6 thanh và trọng âm đặt ở nguyên âm đầu hay
nguyên âm thứ nhì. Tuy vậy, sơ đồ cấu trúc âm tiết tiếng Việt được tác giả mô
tả là một tổ hợp của "phụ âm + nguyên âm + phụ âm". Ðiều đó cho thấy quan
điểm của tác giả vẫn xem âm tiết chỉ là một kết hợp của những âm vị tuyến
tính mà thôi [91].

41
Laurence Thompson (1965) là người tiếp thu những quan điểm của các
tác giả trường phái Nga (như Andreev và Gordina) nhưng đã đẩy xa hơn mà
nhìn nhận vai trò của thanh điệu như là một thành phần không thể thiếu trong
kết cấu âm tiết tiếng Việt. Ông nhận ra cấu trúc âm tiết tiếng Việt chỉ đơn giản
là một kết cấu gồm ba thành phần: âm đầu + hạt nhân + thanh điệu, trong đó
hạt nhân là nguyên âm và bất kì âm vị nào đi theo sau nó. Ở điểm này, tác giả
không nói thêm là "hạt nhân" của âm tiết có phải là một kết hợp bậc hai của
cấu trúc, hay chỉ là sự mở rộng cấu trúc ba phần đó. Chỗ khác ông lại cho
thấy rằng một âm tiết có ít nhất là một nguyên âm và một thanh. [140, tr45].
Sau đó, khi mô tả cấu trúc của thành phần hạt nhân âm tiết, tác giả cho biết là
hạt nhân âm tiết tiếng Việt có thể là gồm một yếu tố (một nguyên âm), hoặc
hai yếu tố (bao gồm một nguyên âm và một bán âm hay một phụ âm cuối),
cũng có thể là một kết cấu ba yếu tố (gồm một nhóm nguyên âm và một phụ
âm cuối). Tác giả không trình bày thêm về mối quan hệ thứ bậc của các "yếu
tố" vừa nêu đối với cấu trúc âm tiết.
Mặc dù vậy, đây là một bước tiến rất lớn trong việc tìm hiểu âm tiết
tiếng Việt. Ít ra là cũng từ đây đã hình thành một quan điểm khác về cách nhìn
cấu trúc âm tiết tiếng Việt. Các tác giả đi sau vẫn thường nối tiếp ông mà phát
triển thêm quan điểm cho rằng âm tiết tiếng Việt là một cấu trúc hai bậc:

Hình 1.9: Cấu trúc âm tiết tiếng Việt theo tầng bậc
2. Trong số những tác giả người Việt nghiên cứu về âm tiết tiếng Việt
có Nguyễn Quang Hồng chủ trương khác hẳn các tác giả khác. Trong một bài
nghiên cứu năm 1974, tác giả dựa trên cơ sở tiếng Việt và tiếng Hán mà chủ

42
trương rằng tiết vị là đơn vị âm thanh cơ bản của ngôn ngữ. Ông có nhận xét
về tính khác biệt của hai loại hình ngôn ngữ Ấn Âu và ngôn ngữ đơn tiết:
trong khi ở các ngôn ngữ loại trên những đơn vị cơ bản của ngôn ngữ là âm
vị, các ngôn ngữ loại dưới lấy âm tiết làm đơn vị phân tích cuối cùng. Ông
theo truyền thống âm vận học Trung Hoa và các nhà đông phương học Nga
mà xem âm tiết tiếng Việt là một cấu trúc chung, "đơn nhất" - hiểu theo nghiã
của tác giả là một đơn vị phân tích ngữ âm nhỏ nhất, một tiết vị . Tác giả cho
rằng âm tiết tiếng Việt chỉ gồm có hai yếu tố cấu thành, là khuôn thanh và
khuôn vần, kết hợp nhau theo thế lưỡng phân. Khuôn thanh có thể vắng mặt,
nhưng khuôn vần luôn luôn có mặt. Khuôn thanh và khuôn vần lại có thanh
điệu là yếu tố siêu đoạn tính thực hiện chức năng khu biệt các hình tiết; ngoài
ra, hình tiết tiếng Việt còn một dạng âm sắc rất đặc biệt, gọi là "hô". Tác giả
cho một vài trường hợp thí dụ về "hô": sự đối lập rõ rệt về "hô" (khai
khẩu/hợp khẩu) trong các cặp âm tiết như kè-què, lan-loan, xiên-xuyên... và
nói thêm là thanh và hô chỉ là những yếu tố phụ trợ, khi thì gắn liền với khuôn
vần, khi thì với khuôn thanh, có khi gắn với cả hai [47, tr 36]. Sơ đồ cấu trúc
âm tiết tiếng Việt theo Nguyễn Quang Hồng là:
thanh

khuôn khuôn
thanh vần
Hình 1.10: Sơ đồ cấu trúc âm tiết tiếng Việt theo Nguyễn Quang Hồng
Quan điểm về âm tiết là đơn vị cơ bản của tiếng Việt thật ra đã được
biết đến từ sớm hơn thế. Cao Xuân Hạo đã trình bày "quan điểm phi đoạn về
âm vị và cấu trúc âm tiết tiếng Việt" (1965), trong đó ông đã khẳng định là
"âm vị tự bản chất là phi đoạn". Tác giả đã nêu ra ba yếu tố của âm tiết phát
sinh đồng thời: thanh điệu, âm chính và tính chất của mối quan hệ cấu âm. Sự
kết hợp phi tuyến tính như vậy cho thấy là âm tiết tiếng Việt không phải là

43
một kết hợp cùng tính chất như trong các ngôn ngữ Ấn Âu. Trong một công
trình quan trọng về cấu trúc âm tiết tiếng Việt ra đời sau đó, ông lại khẳng
định tính không phân lập của âm tiết tiếng Việt. Ông đưa ra một minh hoạ về
tính cách phi đoạn của âm tiết tiếng Việt so sánh với âm tiết Ấn Âu qua thí dụ
về một âm tiết [lun] như sau:

Hình 1.11: Sự khác biệt về cơ cấu của hai loại hình âm tiết
Tác giả Hoàng Tuệ (1972) cũng đã đưa ra một cấu trúc tầng bậc, trong
đó đáng chú ý là tác giả đưa mối quan hệ kết hợp giữa âm chính và âm cuối
vào trong sơ đồ cấu trúc. Khi thừa nhận vai trò khu biệt âm tiết của yếu tố
tuyến điệu trong cấu trúc âm tiết (thanh điệu và quan hệ kết hợp) là thừa nhận
những yếu tố phi tuyến tính bên cạnh những kết hợp tuyến tính của các âm vị
tiếng Việt. Ðây là một điểm mới trong nghiên cứu tiếng Việt.

Hình 1.12: Cấu trúc âm tiết tiếng Việt theo Hoàng Tuệ

44
Quan điểm phi đoạn về âm tiết tiếng Việt về sau được tập trung trong
một công trình lí thuyết quan trọng của Cao Xuân Hạo, Tiếng Việt – Mấy vấn
đề ngữ âm, ngữ pháp và ngữ nghĩa (1998). Lí thuyết phi đoạn về âm tiết tiếng
Việt có ý nghĩa lớn ở chỗ đã nêu lên được tính cách đặc thù của âm tiết tiếng
Việt so sánh với các ngôn ngữ loại hình khác. Mặc dù những đóng góp quan
trọng về lí thuyết ngữ âm học phi đoạn, nhưng cho đến nay, các nhà ngữ âm
Việt Nam dường như vẫn dừng lại ở việc mô tả âm tiết tiếng Việt theo quan
điểm truyền thống dưới đây.
3. Hiện nay quan điểm tầng bậc về cấu trúc âm tiết tiếng Việt vẫn là
một quan điểm được áp dụng rộng rãi. Quan điểm được tác giả Đoàn Thiện
Thuật trình bày trong công trình Ngữ âm tiếng Việt. Tác giả trình bày sơ đồ
cấu trúc âm tiết trên dưới hai dạng: biểu đồ hình cây và hình hộp. Dưới dạng
hình hộp, sơ đồ cấu trúc của tác giả cho thấy rõ tính cách bao trùm của thanh
điệu lên toàn bộ cấu trúc âm tiết:

Hình 1.13: Cấu trúc âm tiết tiếng Việt theo Ngữ âm tiếng Việt (1977) [71]

Lướt qua những quan điểm khác nhau về mô hình cấu trúc âm tiết tiếng
Việt của các tác giả trên đây, có thể thấy rằng chúng phản ánh đà tiến chung
của việc nghiên cứu âm tiết nói chung: sự phát triển việc tìm hiểu âm tiết
tiếng Việt từ Lê Văn Lý đến nay ghi nhận một sự phát triển từ quan niệm chỉ
mô hình hoá những kết hợp của các âm vị tuyến tính (nguyên âm và phụ âm),
đến sự quan tâm đến những yếu tố phi tuyến tính (thanh, mối quan hệ kết hợp
giữa nguyên âm và phụ âm cuối).

45
Như vậy, cấu trúc âm tiết tiếng Việt đã được mô tả theo nhiều quan
điểm khác nhau. Trong luận án này, chúng tôi lấy sơ đồ cấu trúc âm tiết có cả
hai yếu tố đoạn tính và siêu đoạn tính dựa theo quan điểm của tác giả Đoàn
Thiện Thuật trong công trình Ngữ âm tiếng Việt làm cơ sở để phân tích.
1.5.2. Quan hệ giữa các đơn vị đoạn tính và siêu đoạn tính trong âm tiết
Âm tiết tiếng Việt không chỉ là sự kết hợp của các âm vị đoạn tính, mà
còn các yếu tố siêu đoạn tính cũng làm nên nét đặc trưng có ý nghĩa của âm
tiết. Trong nội bộ âm tiết tiếng Việt, có nhiều mối quan hệ như: quan hệ giữa
âm đầu và âm chính, quan hệ giữa âm chính và âm cuối, quan hệ giữa phụ âm
cuối và thanh.
Những yếu tố phi đoạn này của cấu trúc âm tiết có tính cách khác với
thanh điệu, là yếu tố phi đoạn khác có ý nghĩa âm vị học nổi bật. Vả chăng,
các mối quan hệ này đều đã được biểu hiện bên cạnh các yếu tố đoạn tính:
chẳng hạn quan hệ chặt giữa nguyên âm và phụ âm cuối thường biểu hiện qua
một nguyên âm ngắn hay một phụ âm cuối chặt. Thanh điệu là yếu tố phi
tuyến tính của âm tiết bên cạnh các yếu tố tuyến tính khác, và như thế thì
thanh là một thành phần cấu tạo của âm tiết tiếng Việt.
Những cứ liệu thực nghiệm ngữ âm cho thấy thanh điệu ảnh hưởng
vào phụ âm đầu rất yếu ớt so với phần còn lại của âm tiết. Thanh ảnh hưởng
mạnh nhất ở đỉnh âm tiết và nó còn gắn vào cả âm cuối. Khi phát âm một âm
tiết nào đó, chỉ số đo độ cao của phần cuối âm tiết trước khi dứt âm tiết xác
nhận điều đó.
Vai trò của thanh trong âm tiết là một vấn đề cho đến nay chưa được
giải quyết cặn kẽ. Nghiên cứu thực nghiệm ngữ âm có thể là cơ sở để có
những kết luận rõ ràng thêm nữa về chức năng của thanh trong kết hợp âm
tiết. Là một âm vị phi tuyến tính, thanh không chỉ tác động lên một âm vị
tuyến tính mà còn là yếu tố tạo âm sắc chung cho cả âm tiết. Tuy vậy, âm

46
chính vẫn là thành phần âm tiết bị ảnh hưởng bởi thanh điệu ở mức độ cao
nhất. Âm đầu và âm cuối không có đầy đủ âm lượng để có thể "nhiễm" thanh
mạnh hơn âm chính được. Khi kéo dài một âm tiết, có hiện tượng thanh gắn
rõ nét ở âm cuối nếu so với âm đầu. Nhưng âm lượng ở giai đoạn khép âm tiết
đã giảm rất nhiều, khó mà có thể nói đến sự kết hợp chặt dần ở phía cuối âm
tiết với hàm ý rằng thanh nhiễm mạnh vào âm cuối. Thanh nhiễm mạnh nhất
là ở đỉnh âm tiết, và chỉ ở đỉnh mà thôi. Nếu âm tiết khép có các phụ âm
cuối /p, t, k/ chỉ mang thanh sắc và nặng, là vì những phụ âm đó phát ra đều
kèm theo hiện tượng nghẽn thanh hầu, như hai thanh sắc và nặng.

47
CHƯƠNG 2: MỐI QUAN HỆ GIỮA FORMANT CỦA
NGUYÊN ÂM VÀ THANH ĐIỆU

Chương này trình bày mối quan hệ của các thanh điệu cụ thể là quan hệ
của tần số cơ bản F0 đối với cấu trúc formant của nguyên âm.
Về mặt vật lí, thanh điệu là sự vận động của thanh cơ bản (F0), trong
quá trình phát âm âm tiết. Sự vận động của F0 (đường nét âm điệu) có thể
biểu diễn dưới dạng đường cong như là đồ thị của hàm sóng âm, phụ thuộc
vào thời gian. Tần số của thanh cơ bản làm thành độ cao hay âm vực của
giọng trong suốt quá trình phát âm. Do đó, sự thay đổi độ cao của thanh cơ
bản sẽ cho những đường nét lên xuống của thanh điệu và ngữ điệu. Tần số
thanh cơ bản F0 mang tính tương đối; nhưng đặc trưng cho từng thanh điệu.
Đường nét F0 được xác định bằng sự biến đổi tần số dao động của dây thanh,
do các cơ thanh quản, cũng như áp suất dòng khí đi qua thanh môn điều phối.
Như vậy, thanh điệu là tổng hòa các tiêu chí về độ cao, kết hợp với sự điều
phối các cơ của thanh quản, và dòng khí đi qua thanh môn tạo nên các kiểu
tạo thanh khác nhau.
2.1. Trường độ formant của nguyên âm trong kết hợp với thanh
điệu
Về trường độ, các mẫu khảo sát cho thấy thanh điệu có ảnh hưởng đến
trường độ của các nguyên âm. Do những thể hiện về đường nét gãy, trắc trong
phân bố cường độ và cao độ mà các thanh trắc cũng bị ngắn lại. Khi đo
trường độ nguyên âm ở tất cả các mẫu trong kết hợp với thanh điệu chúng tôi
nhận thấy đối với các thanh bằng như huyền và ngang, trường độ của nguyên
âm dài hơn khi kết hợp với các thanh trắc. Trong đó khi kết hợp với thanh

48
huyền, nguyên âm có trường độ dài nhất từ 322 - 408 ms. Thanh nặng có
trường độ ngắn nhất 158 – 202 ms. Chính sự kéo dài trường độ của nguyên
âm khiến cho cấu trúc formant của nguyên âm cũng dài ngắn tuỳ theo các kết
hợp thanh điệu.
Trong tương quan so sánh thì nguyên âm khi kết hợp với thanh điệu có
thể sắp xếp theo trật tự: từ dài đến ngắn tính theo ms như sau: huyền - ngang -
ngã - sắc - hỏi - nặng. Trường độ của nguyên âm khi kết hợp với thanh điệu ở
cả hai nhóm CTV nam và nữ được minh họa bằng bảng và biểu đồ sau:
CTV Nam
Thanh điệu Trường độ (ms)
Huyền Ngang Ngã Sắc Hỏi Nặng

Nguyên âm
/i/ 371 363 313 256 267 158
/e/ 332 324 301 257 233 184
// 357 352 301 258 220 178
// 331 328 300 274 254 176
// 339 333 276 276 254 167
/a/ 322 317 271 290 222 159
/u/ 341 333 275 258 247 186
/o/ 345 331 291 289 257 197
// 367 333 288 291 228 160

Bảng 2.1: Trường độ nguyên âm trong kết hợp với thanh điệu CTV nam

49
Biểu đồ 2.1: Trường độ nguyên âm kết hợp với thanh điệu CTV nam
Thanh điệu Trường độ (ms)
Huyền Ngang Ngã Sắc Hỏi Nặng

Nguyên âm
/i/ 379 328 314 260 259 202
/e/ 415 353 298 286 276 216
// 368 346 283 299 280 185
// 394 354 272 264 257 199
// 408 363 305 272 288 195
/a/ 407 351 312 288 266 171
/u/ 380 371 289 280 274 187
/o/ 404 364 322 294 266 227
// 370 367 294 273 259 165

Bảng 2.2: Trường độ nguyên âm trong kết hợp với thanh điệu CTV nữ

50
Biểu đồ 2.2: Trường độ nguyên âm kết hợp với thanh điệu CTV nữ
2.2. Vùng tần số formant của nguyên âm trong kết hợp với thanh
điệu
Về cấu trúc formant, những thanh có đường nét gãy, trắc làm cho phần
cuối của nguyên âm mà nó kết hợp có những biến động về vùng phân bố
formant giữa F1 và F2.
So sánh kết quả nghiên cứu vùng tần số formant của nguyên âm tiếng
Việt của Nguyễn Văn Ái (1973) và kết quả nghiên cứu của chúng tôi như sau:
Nguyên Nghiên cứu của chúng tôi Nguyễn Văn Ái (1973)
âm Nữ Nam
F0 F1 F2 F0 F1 F2 F1 F2
/i/ 257 312 2881 165 291 2231 250 - 420 2380 - 3360
/e/ 254 516 2420 154 394 2239 354 - 595 2000 - 2830
// 224 685 2569 153 598 2304 595 - 840 1630 - 2380
// 280 353 1303 153 399 1296 250 - 420 840 - 1190
// 240 548 1225 151 453 1290 354 - 595 1000 - 1190
/a/ 228 897 1937 150 994 1749 707 - 1000 1190 - 1410
/u/ 276 345 811 153 466 2125 250 - 420 595 - 840
/o/ 256 509 979 148 456 963 354 - 595 707 - 1000
// 241 744 1216 146 793 1116 595 - 707 840 - 1000

Bảng 2.3: Vùng tần số của các nguyên âm

51
Kết quả nghiên cứu của Nguyễn Văn Ái cho thấy, những F1 của các
nguyên âm dòng trước, dòng giữa và dòng sau có cùng độ nâng lưỡi thường
nằm trong vùng tần số formant giống nhau hoặc gần giống nhau. Ví dụ: /i, ,
u/, /e, , o/ nằm ở những vùng tần số giống nhau và vì thế chúng có thể thay
thế nhau được ở vùng tần số F1 này. Những tiêu chí khu biệt các nguyên âm
cùng nhóm trên là ở những F2 có vùng tần số lớn hơn các F1. Nguyên âm
dòng trước /i, e, / có vùng tần số F1 và vùng tần số F2 nằm cách xa nhau; /u,
o, / là những nguyên âm dòng sau, bản thân chúng có vùng tần số F1 và F2
cách nhau trung bình.
Trong nghiên cứu của chúng tôi, tần số của các nguyên âm không hoàn
toàn giống nhau và khó có thể kết luận chúng có thể thay thế nhau. Đặc biệt,
khi kết hợp với các thanh điệu khác nhau, vùng tần số formant của các
nguyên âm có sự thay đổi không chỉ phụ thuộc vào giọng nam, nữ mà còn tùy
vào kết hợp thanh điệu. Tuỳ từng nguyên âm mà tần số formant F1 của các
CTV nữ cao hơn so với các CTV nam từ 30Hz – 200Hz. Tuy nhiên, sự thay
đổi vùng tần số formant của các nguyên âm không nhiều lắm thông thường là
cao hơn so với kết hợp với thanh ngang. Đối với tần số F1, F2 khi nguyên âm
kết hợp với các thanh điệu khác như huyền, ngã, hỏi, sắc, nặng vùng tần số
cao hơn so với kết hợp với thanh ngang từ 20 đến 300 Hz. Có thể khái quát
vùng tần số formant của nguyên âm khi kết hợp với 6 thanh điệu tiếng Việt
qua bảng sau:

52
Nguyên Ngang Huyền Ngã Hỏi Sắc Nặng
âm F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3
339 1997 311
i 165 324 2382 3171 103 379 2262 3030 171 293 2511 3203 108 418 2290 2986 166 294 2404 3119 126
447 1874 285
ê 154 413 2137 2801 101 587 1945 2611 178 409 2123 2743 102 547 1969 2567 152 386 2121 2730 112
449 2029 262
e 153 580 2077 2619 97 601 1960 2531 190 559 2087 2729 95 717 2113 2628 149 521 2049 2832 121
405 1320 233
ư 153 314 1430 2581 99 419 1465 2652 180 331 1355 2628 103 463 1442 2666 159 335 1410 2543 158
551 1257 262
ơ 151 414 1303 2536 94 657 1447 2661 197 415 1221 2624 102 694 1321 2456 140 387 1266 2539 115
582 1614 237
a 150 751 1537 2459 97 868 1666 2428 184 745 1613 2257 97 894 1599 2344 142 694 1534 2217 111
375 725 281
u 153 362 1058 2689 102 422 1127 2808 194 346 826 2607 102 435 1353 3076 161 339 865 2686 116
511 948 284
ô 148 416 869 2632 97 574 1258 2834 193 424 881 2718 101 579 1238 2871 146 447 1107 2954 116
852 1065 229
o 146 728 1161 2384 96 831 1130 2413 165 664 1136 2337 101 888 1013 2366 144 654 1117 2446 112

Bảng 2.4: Vùng tần số formant trung bình của các nguyên âm kết hợp với thanh điệu CTV Nam

1
Nguyên Ngang Huyền Ngã Hỏi Sắc Nặng
âm F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3 F0 F1 F2 F3
413 2902 350
i 257 312 2881 3573 204 350 2780 3450 275 363 2933 3506 189 334 2913 3511 230 337 2945 3465 214
508 2412 299
ê 254 516 2420 3442 189 493 2395 3309 271 570 2334 3386 173 486 2446 3360 208 510 2488 3418 204
776 1810 278
e 224 685 2569 3437 191 618 2539 3438 265 677 2515 3461 175 688 2608 3466 250 702 2604 3479 201
489 1444 308
ư 280 353 1303 3506 196 379 1288 3056 294 430 1330 3399 186 379 1235 3140 267 401 1274 3287 268
667 1414 310
ơ 240 548 1225 3564 196 530 1321 3211 273 632 1304 3500 178 532 1312 3232 244 547 1281 3352 206
941 1873 319
a 228 897 1937 3265 184 846 1630 2678 270 833 1652 2810 175 821 1740 3009 228 863 1743 3248 191
488 739 289
u 276 345 811 3440 196 365 619 3267 329 397 701 3278 185 370 652 3183 271 379 649 3189 225
603 965 323
ô 256 509 979 3414 186 455 790 3128 283 546 891 3375 178 450 817 3174 237 466 800 3263 207
984 1314 324
o 241 744 1216 3315 183 709 1154 2787 284 693 1084 3002 166 719 1164 2440 264 718 1113 3140 194

Bảng 2.5: Vùng tần số formant trung bình của các nguyên âm kết hợp với thanh điệu CTV Nữ

2
Cũng như trường độ, vùng tần số formant cung cấp cho một số lớp
thông tin đến người nghe. Nó là yếu tố cung cấp lớn đối với chất lượng
nguyên âm, nó giúp chúng ta nhận ra giới tính và tuổi tác của người nói và nó
có thể trong một số trường hợp làm phương tiện phân biệt giữa các cá nhân.

2.2.1. Vùng tần số của nguyên âm /i/


Khi kết hợp với thanh ngang tần số formant của /i/ thấp nhất 291Hz đối
với nam và 312Hz đối với nữ. Sự kết hợp với các thanh điệu khác làm cho tần
số F1 của /i/ có xu hướng tăng từ 10 đến 50Hz, F2 có xu hướng tăng cao hơn
từ 30 đến 300Hz so với tần số F2 của /i/ khi kết hợp với thanh ngang. Nhìn
chung, khi kết hợp với thanh điệu tần số formant của /i/ dao động trong
khoảng F1 291 - 366Hz, F2 2231-2968Hz. Có thể hình dung cụ thể bằng biểu
đồ sau:

90
i ii
ii iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii i
372 i iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii
iiiiiiii
iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii i

654
F1 (Hz)

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.3: Vùng tần số của nguyên âm /i/

1
2.2.2. Vùng tần số của nguyên âm /e/
Đối với nguyên âm /e/ thanh điệu không làm ảnh hưởng đến F2, ở tất
cả các kết hợp thanh điệu F2 luôn ổn định ở tần số 2210Hz (các CTV nam),
và 2420Hz (CTV nữ). Thanh điệu làm thay đổi tần số F1, kết hợp với thanh
ngang F1 có tần số thấp nhất 394Hz (nam), 510Hz (nữ), sự kết hợp với thanh
ngã khiến cho tần số formant của nguyên âm F1 biến đổi từ thấp đến cao và
tần số cao nhất 495Hz (nam), 570Hz (nữ).

90
êêêêê
êêêêêêê
372 êêê
êêêêêêêêêêê
êêêêê
êê êêêêê
êêê êêêêêê êêêêêêêê
êêêêêêê
êêêê êêêê êêêêê
êêêêê
êêêêêêêêêêêêêêêêêêêêê ê
654 ê êêêêê ê
êêêêêê êê
F1 (Hz)

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.4: Vùng tần số của nguyên âm /e/

2.2.3. Vùng tần số của nguyên âm / /

Cũng tương tự như nguyên âm /e/ thanh điệu không làm biến đổi tần số
F2 của //, F2 luôn duy trì ổn định ở tần số 2300Hz (nam), 2500Hz (nữ).
Thanh điệu khiến F1 của // có xu hướng tăng dần trong khoảng 571-708Hz
tùy từng kết hợp. Trong đó kết hợp với thanh ngã làm biến đổi F1 lên cao
nhất, thanh ngang F1 thấp nhất.

2
90

372 e
e
eeeeeee
e eeeeeeeeeeeeee e
654 eeeeee
eeeeeeee eeeeeee
eeeeeeee
eeeeeeeeee
eeeeeeeeeeee
eeeee
eeeeee eeeeeeeeeeeee
F1 (Hz)
eeeeee e
eeeeee eeee
eee e eee
936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.5: Vùng tần số của nguyên âm //

2.2.4. Vùng tần số của nguyên âm / /

Thanh điệu không chỉ làm biến đổi tần số F1 mà còn làm F2 của //
thay đổi đáng kể, F1 thấp nhất khi kết hợp với thanh ngang 399Hz (nữ),
353Hz (nam) F1 dao động trong khoảng 353- 710Hz, sự kết hợp với thanh
ngã làm cho F1 tăng mạnh. Đối với F2 tần số thấp nhất khi kết hợp với thanh
nặng 1190Hz và cao nhất khi kết hợp với thanh ngã 1659Hz.

90
uwuwuw
uw
uw
uwuwuw
uw
uw uw
372 uw
uw
uwuw
uw
uw
uw
uw
uwuw
uwuw
uw uuw
uw
uwuw
uw
uw
uw
uwuw
uw
uw
uwwuw
uw
uuw
w
uwuw
uwuw
u
uw
uwu
uw
w
uw
uw
u
uwuw
uw
uw
uw
uw uw
uw
uw
u
w
uw
uw
wuw
wuw
uwuw
uwuw
uw
uw
uw uw
uwuw
uwuw
uw
wuw
uuw
uw
uw uw
uw
uwuw
uw
uuw
w
uwuw
uw uw
uw
uw
uw uw
uw
uw
654
F1 (Hz)

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.6: Vùng tần số của nguyên âm //

3
2.2.5. Vùng tần số của nguyên âm / /

Vùng tần số F1 của // dao động trong khoảng từ 400 đến 700Hz, trong
đó các kết hợp với thanh ngang, thanh sắc có tần số thấp từ 400 đến 450Hz,
các kết hợp với thanh nặng có tần số cao nhất. Vùng tần số F2 thay đổi không
đáng kể chủ yếu dao động trong khoảng 1200-1400Hz.

90
ow
owow
ow
372 owow
ow
ow ow
owow
owow
ow
ow
ow
ow
ow
ow
owow
ow
ow
owow
owow
ow
ow ow
ow
ow ow
owow
oow
w
ow
ow
ow
ow
ow ow
ow
ow
ow
ow ow
ow
ow
ow
oow
oww
ow
ow
ow ow
owow
ow ow
owow
ow
ow ow
ow
ow
ow
ow
ow
owow
owowow
ow
ow
ow
ow
ow
oowo
o
ow
ow
ow
ow ow
w w
w
owow
654 ow
owow ow
ow
owow
ow
ow
ow
F1 (Hz)

ow ow
ow

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.7: Vùng tần số của nguyên âm //

2.2.6. Vùng tần số của nguyên âm /a/


Formant của nguyên âm /a/ bị ảnh hưởng lớn bởi thanh điệu, các thanh
điệu làm cho forman của /a/ phân tán rời rạc lúc lên cao lúc xuống thấp không
ổn định. Khoảng tần số F1 chuẩn của /a/ 707-1000Hz, F2 1190-1410Hz, tuy
nhiên trong kết hợp với các thanh điệu tần số F1 của /a/ đôi khi xuống rất
thấp thậm chí chỉ ở mức tần số 431Hz, 480Hz khi kết hợp với thanh ngã,
thanh sắc. Đối với F2 sự ảnh hưởng của thanh điệu khiến F2 của /a/ có chiều
ngược lại, đó là tần số F2 tăng vọt dao động trong khoảng từ 1519 -1951Hz,
sự ảnh hưởng này thể hiện rõ nét nhất ở các thanh ngã, hỏi, sắc, nặng.

4
90

a
372 a a
a aa aa a
a aa a
a
654 a
F1 (Hz)

aa a
a a aaaaa a a
936 a aa
aa
a a a aaaaaa aaaaa
aa a a a
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aa a
a
aaaaa a a a
1218 aaaaaaaa a
aaaaaaaaaaaa aa
aa
aaa
a
1500 aa a aa
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.8: Vùng tần số của nguyên âm /a/

2.2.7. Vùng tần số của nguyên âm /u/


Kết hợp với các thanh điệu F1 của /u/ dao động trong khoảng 322-
510Hz, F2 nằm trong khoảng khá rộng 647-1700Hz, trong đó kết hợp với các
thanh cao như thanh ngang, thanh ngã có tần số F2 cao hơn các thanh khác.

90
uu u
372 uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu
uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu
u
uu u
uuuuu uu
654 u
F1 (Hz)

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.9: Vùng tần số của nguyên âm /u/

5
2.2.8. Vùng tần số của nguyên âm /o/
Tần số đặc trưng của /o/ theo nghiên cứu của Nguyễn Văn Ái nằm
trong khoảng F1 345-595Hz, F2 707-1000Hz. Khi kết hợp với các thanh điệu
tần số của /o/ tăng lên từ 100 đến 200Hz tùy theo kết hợp thanh điệu. Theo
nghiên cứu của chúng tôi /o/ khi kết hợp với thanh điệu có F1 thấp nhất
420Hz cao nhất 550Hz. F2 khi kết hợp với thanh điệu dao động trong khoảng
820Hz - 1370. Như vậy, khi kết hợp với các thanh điệu tần số formant của
nguyên âm /o/ tăng lên đối với cả F1 và F2 từ 100 đến 400Hz.

90
ôôôôôôôôô
ôô ôôôô
372 ôôôôô
ôôôôôô
ô ô
ô ôô ôôô ôôôôôôôôôôôôôôôôôôôôôôôôô
ô
ô ô
ô ô
ô
ôô
ôôôôôô ôôô ô
654 ôôôô ôôô ô
ôô
F1 (Hz)

ô
936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.10: Vùng tần số của nguyên âm /o/

2.2.9. Vùng tần số của nguyên âm / /

Đối với nguyên âm dòng sau // tần số F1 trung bình của // nằm trong
khoảng 595-707Hz, F2 trong khoảng 840-1000Hz. Khi kết hợp với 6 thanh
điệu khoảng tần số này cao hơn rất nhiều so với nghiên cứu trước đó. Cụ thể
F1 của // dao động trong khoảng rất rộng 430 - 1124Hz, F2 của // 1002 -
1429Hz.

6
90

372

654
F1 (Hz)

936

1218

1500
3500 2880 2260 1640 1020 400
F2 (Hz)

Biểu đồ 2.11: Vùng tần số của nguyên âm //


2.3. Diễn tiến formant của nguyên âm trong kết hợp với thanh điệu
Nói về sự diễn tiến F0 theo thời gian (đường nét) có thể thấy là ở các
thanh trắc cũng có đặc điểm phân bố theo cấu trúc tuyến tính của âm tiết.
Những thanh có chứa các đường nét đặc biệt này thường thể hiện những điểm
đặc biệt về đường nét ở phần cuối âm tiết. Tuy nhiên những biến đổi về
đường nét F0 ở phần cuối cấu trúc thanh điệu lại gồm nhiều biến thể khác
nhau đối với từng thanh, nhất là ở phần cuối cùng của chúng. Cụ thể: Ở
những mẫu nguyên âm có thanh điệu đi kèm, trong khoảng thời gian 50 – 60
ms đầu tiên F1, F2 của các nguyên âm bị ảnh hưởng: F1 bắt đầu cao hơn, F2
cao hơn hoặc thấp hơn rất nhiều so với tần số của nó khi kết hợp với thanh
ngang.

2.3.1. Diễn tiến formant của nguyên âm trong kết hợp thanh ngang
Kết hợp với thanh ngang khiến cho F1 của hầu hết các nguyên âm đều
xuất phát từ tần số cao nằm trong vùng tần số đặc trưng của các nguyên âm,
sau đó có diễn tiến đi xuống và đạt mức thấp nhất ở điểm cuối cùng của diễn
tiến formant. F1 của nguyên âm /i/ bắt đầu ở khoảng tần số 355Hz hơi đi lên ở

7
đoạn đầu đạt điểm cao nhất 408 Hz tại 50ms đầu tiên, sau đó có diễn tiến đi
xuống đều đặn và đạt mức tần số thấp nhất khoảng 300 Hz. F1 của nguyên âm
/e/ xuất phát từ 474 Hz đi xuống đều đặn và kết thúc ở 261Hz. F1 của // xuất
phát từ 492 Hz và kết thúc ở điểm thấp 289Hz. F1 của // xuất phát ở tần số
477 Hz và kết thúc tại tần số 258Hz. F1 của // xuất phát ở tần số 534Hz và
kết thúc ở tần số 346Hz. F1 của /a/ xuất phát ở tần số 707Hz có diễn tiến đi
xuống đều đặn đến khoảng 50ms cuối thì đột ngột giảm và kết thúc ở tần số
rất thấp 308Hz. F1 của /u/ xuất phát 437Hz có xu hướng giảm dần đều đặn và
kết thúc ở tần số 336Hz. F1 của /o/ xuất phát tại 446Hz và đi xuống mức thấp
nhất ở tần số 273Hz. F1 của // xuất phát tại tần số cao đặc trưng của //
683Hz sau đó đi xuống đều đặn và kết thúc tại điểm có tần số rất thấp 303Hz.
Ngược lại, ở tần số F2 diễn tiến đường nét formant của các nguyên âm
có ba dạng: một dạng xuất phát ở tần số thấp sau đó đi lên và kết thúc ở tần số
cao, dạng này xảy ra đối với các nguyên âm dòng trước /i, e, / và dòng
giữa /, , a/, nhiều chỗ cấu trúc formant bị phá vỡ, nhất là cấu trúc F2 của các
nguyên âm dòng trước /i, e, /. Dạng đường nét thứ hai xuất phát ở tần số cao
sau đó có đường nét đi xuống và hơi đi lên ở phần cuối trường hợp hai
nguyên âm dòng sau /u,o/, riêng // có đường nét F2 tương đối bằng phẳng từ
đầu đến cuối.

8
Hình 2.1.Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o,  trong kết hợp thanh
ngang/, CTV nam

2.3.2. Diễn tiến formant của nguyên âm trong kết hợp thanh huyền
Cũng tương tự như thanh ngang khi kết hợp với thanh huyền diễn tiến
F1 của các nguyên âm xuất phát từ tần số cao sau đó đi xuống đều đặn và kết
thúc ở tần số rất thấp. Diễn tiến F2 có chiều hướng ngược lại, có hướng đi lên.
Tuy nhiên, ở trường hợp nguyên âm /o/ F2 lại có chiều hướng đi xuống. Kết
hợp với thanh huyền làm cho cấu trúc F2 của // bị phá vỡ.
Có thể nói, sự kết hợp với thanh ngang và thanh huyền không làm mất
đi cấu trúc đặc trưng formant của các nguyên âm. Nhìn chung, chúng vẫn giữ
sự ổn định từ đầu đến cuối.

9
Hình 2.2: Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o, / kết hợp với
thanh huyền, CTV nam

2.3.3. Diễn tiến formant của nguyên âm trong kết hợp thanh ngã
Kết hợp với thanh ngã làm cho cấu trúc F1 của nguyên âm đi xuống
không đều đặn, thỉnh thoảng có đoạn đi lên ở giữa khiến cho đường nét F1 có
hình sóng. Một số đoạn cấu trúc formant của /a, u, / bị phá vỡ. Thanh ngã có
ảnh hưởng lớn đến cấu trúc F2 của nguyên âm. Sự ảnh hưởng này thể hiện rõ
ở việc phá vỡ các đường nét F2 nhất là ở các nguyên âm dòng trước /i, e, /,
khiến cho F2 chỉ là những điểm rời rạc, đứt đoạn.

Hình 2.3:Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o, / kết hợp với
thanh ngã, CTV nam

2.3.4. Diễn tiến formant của nguyên âm trong kết hợp thanh hỏi
Nhìn chung F1 của nguyên âm khi kết hợp với thanh hỏi có dạng đi
xuống đều đặn, càng về cuối diễn tiến formant mất ổn định cấu trúc bị phá vỡ

10
thành những điểm rời rạc với tần số rất thấp, những nguyên âm dòng sau /u,
o, / cấu trúc F1 bị đứt đoạn. Ở khu vực F2 cấu trúc chỉ được giữ vững với hai
nguyên âm /i, e/, các nguyên âm còn lại F2 bị phá vỡ thành các điểm lên
xuống rời rạc không ổn định.

Hình 2.4: Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o, / kết hợp với
thanh hỏi, CTV nam

2.3.5. Diễn tiến formant của nguyên âm trong kết hợp thanh sắc
Kết hợp với thanh sắc diễn tiến F1 các nguyên âm bắt đầu ở tần số cao,
đi xuống đều đặn và kết thúc ở tần số thấp, cấu trúc F1 luôn được duy trì.
Trong khi đó, F2 bị phá vỡ cấu trúc thành các điểm rời rạc ở các nguyên âm
dòng trước, dòng giữa. Các nguyên âm dòng sau có diễn tiến F2 ổn định đi
lên ở đoạn cuối, và kết thúc ở cao độ cao.

11
Hình 2.5: Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o, / kết hợp với
thanh sắc, CTV nam

2.3.6. Diễn tiến formant của nguyên âm trong kết hợp thanh nặng
Kết hợp với thanh nặng F1 của các nguyên âm tương đối bằng phẳng,
F2 không ổn định đối với các nguyên âm dòng trước và dòng giữa, có đôi chỗ
cấu trúc bị phá vỡ.

Hình 2.6: Diễn tiến formant của 9 nguyên âm /i, e, , , , a, u, o, / kết hợp
với thanh nặng, CTV nam

12
2.4. Tiểu kết
Từ những khảo sát về cấu trúc formant của nguyên âm trong kết hợp với
thanh điệu cho phép chúng tôi rút ra một số nhận xét như sau:
Các khía cạnh chiết đoạn và siêu đoạn của tín hiệu lời nói không hành
chức một cách độc lập với nhau. Có nhiều sự tương tác lẫn nhau quan trọng
giữa cấu trúc chiết đoạn ở đây là nguyên âm và mô hình cao độ của thanh
điệu đi kèm. Cụ thể:
- Thanh điệu có ảnh hưởng đến trường độ của nguyên âm, các kết hợp
nguyên âm với thanh ngang, ngã có trường độ dài hơn các kết hợp với thanh
sắc, hỏi, nặng.
- Thanh điệu cũng tác động đến vùng tần số của các nguyên âm đơn
tiếng Việt. Nhìn chung, những ảnh hưởng của thanh điệu làm cho tần số F1,
F2 của nguyên âm tăng lên đáng kể. Sự ảnh hưởng này xảy ra ở các kết hợp
thanh cao, nhất là đối với các kết hợp thanh ngang, ngã, sắc.
- Thanh điệu có ảnh hưởng tới diễn tiến formant của các nguyên âm
ngay ở phần đầu, sự ảnh hưởng này kéo vùng tần số formant của nguyên âm
cao hơn hoặc thấp hơn tần số thông thường của nó tạo nên một đoạn đi lên
hoặc đi xuống giữa thanh điệu và nguyên âm mà nó kết hợp. Điều này biến
đổi cấu trúc đường nét formant làm cho nó có thể đi lên hay đi xuống ở phần
đầu so với cấu trúc ban đầu. Một số thanh điệu khiến cho tần số F2 của
nguyên âm không ổn định mà bị phá vỡ thành các điểm rời rạc.
Các giá trị âm học cấu trúc formant của nguyên âm trong kết hợp với
thanh điệu đã trình bày ở trên là cơ sở để chúng tôi so sánh với kết quả khảo
sát của những chương tiếp theo.

13
CHƯƠNG 3: FORMANT CỦA NGUYÊN ÂM
TRONG KẾT HỢP VỚI ÂM ĐẦU VÀ THANH ĐIỆU

Chương này trình bày đặc điểm cấu âm của các âm tắc, sự ảnh hưởng
của nhóm phụ âm tắc vô thanh /p, t, k/, nhóm phụ âm mũi /m, n, ŋ/ trên các
phương diện: vùng tần số, diễn tiến đường nét đoạn quá độ và trường độ
formant của nguyên âm.
3.1. Formant của nguyên âm trong kết hợp với âm đầu /p, t, k/ và
thanh điệu
Các âm tắc [p, t, k] trong tiếng Việt có một động tác khép hoàn toàn
trước một động tác mở ra. Khởi âm đột ngột phân biệt cấu âm của các phụ âm
tắc với các phụ âm xát. Khởi âm của các âm xát là từ từ còn đặc điểm cơ bản
của các âm tắc, ngược lại, là một dải sóng điếc có một khoảng im lặng đằng
trước, mà dưới những điều kiện nhất định thì một xung động của các dải
thanh âm có thể bị thay thế. Những ảnh phổ ở đây cho thấy một đường vuông
góc có một khoảng im lặng (âm tắc vô thanh) hoặc một khoảng hữu thanh
đứng trước (âm tắc hữu thanh). Sự dịch chuyển lên phía trên của thanh quản,
với dây thanh khép lại, nén không khí ở phía trên lại và làm cho luồng khí đi
ra. Trong tiếng Việt, khởi âm đột ngột với một dải sóng điếc im lặng đằng
trước của [t] như trong từ ti hay của [k] như trong từ ki đối lập với khởi âm
mượt mà, có một khoảng hữu thanh của [m] như trong từ mi hay [n] như trong
từ ni.

14
Hình 3.1: Khởi âm đột ngột với dải sóng điếc của [t] trong âm tiết ti

Hình 3.2: Khởi âm mượt mà với dải hữu thanh kéo dài của [m] trong âm tiết mi

3.1.1. Trường độ formant của nguyên âm


Ở phần trước chúng tôi đã đề cập một cách khái quát đến trường độ của
nguyên âm. Trong một phạm vi nào đó, trường độ phụ thuộc và bị chi phối
bởi nhiều yếu tố khác nhau, cụ thể là bởi chất lượng của nguyên âm và các
phụ âm đứng sát cạnh nguyên âm. Theo kết quả nghiên cứu, ảnh hưởng của
các phụ âm kế cận lên trường độ nguyên âm là rất khác nhau, và không phải
lúc nào cũng dễ dàng phân biệt sự ảnh hưởng của một phụ âm đứng cạnh với

15
những nét phát âm riêng một cách giản đơn đối với nguyên âm liên quan. Các
kết quả khảo sát cho thấy phụ âm tắc /p, t, k/ cùng với thanh điệu có ảnh
hưởng trực tiếp đến trường độ formant của nguyên âm trong ngữ cảnh CV.
Các nguyên âm khi đứng sau các phụ âm này có trường độ formant ngắn hơn
từ 50 đến 100 ms.
p Nguyên
ngang huyền ngã hỏi sắc nặng âm
363 371 313 267 256 158 [i]
324 332 301 233 257 184 [e]
352 357 301 220 258 178 []
328 331 300 254 274 176 []
333 339 276 254 276 167 []
317 322 271 222 290 159 [a]
333 341 275 247 258 186 [u]
331 345 291 257 289 197 [o]
269 []
Bảng 3.1: Trường độ formant nguyên âm trong kết hợp với phụ âm /p/ và
thanh điệu
t Nguyên
ngang huyền ngã hỏi sắc nặng âm
328 379 260 259 314 202 /i/
353 415 286 276 298 216 /e/
346 368 299 280 283 185 /
354 394 264 257 272 199 /
363 408 272 288 305 195 /
351 407 288 266 312 171 /a/
371 380 280 274 289 187 /u/
364 404 294 266 322 227 /o/
367 370 273 259 294 165 /

16
Bảng 3.2: Trường độ formant nguyên âm trong kết hợp với phụ âm /t/ và
thanh điệu
k Nguyên
ngang huyền ngã hỏi sắc nặng âm
389 412 297 286 337 202 /i/
381 405 294 296 344 205 /e/
381 389 301 267 338 191 /
392 425 317 274 337 248 
392 389 297 243 356 195 /
368 394 308 298 355 191 /a/
373 404 291 305 342 208 /u/
395 427 305 291 367 212 /o/
387 400 317 258 352 217 /
Bảng 3.3: Trường độ formant nguyên âm trong kết hợp với phụ âm /k/ và
thanh điệu
Trong tương quan với trường độ của nguyên âm, các phụ âm tắc cũng
có trường độ rất ngắn, cụ thể /k/ là phụ âm có trường độ dài nhất 16ms, sau đó
là /p/ 15 ms và /t/ ngắn nhất 10ms.

17
Biểu đồ 3.1: Trường độ formant nguyên âm trong kết hợp với /p, t, k/
Bảng và biểu đồ trên cho thấy trường độ formant của nguyên âm khi
đứng sau các phụ âm tắc vô thanh có xu hướng bị rút ngắn, điều này chứng tỏ
vị trí cấu âm của các phụ âm tắc /p, t, k/ chắc chắn có ảnh hưởng đến trường
độ formant của nguyên âm. Trong số đó, một phụ âm khi phát âm đòi hỏi phải
có một sự dịch chuyển của lưỡi như [t, k], thì cần phải có thời gian hơn để tạo
ra một phát âm phụ âm tính điều này làm cho nguyên âm đứng cạnh có
trường độ dài hơn. Vì vậy, các nguyên âm sẽ dài hơn khi đứng sau các phụ âm
lợi và các âm mạc so với khi đứng sau các âm hai môi như [p]. Cụ thể: nếu
như trường độ formant trung bình của nguyên âm trong kết hợp với /p/ có
trường độ ngắn nhất chỉ khoảng 289 ms thì kết hợp với /t/ và /k/ trường độ
này gia tăng thêm 313 ms và 334 ms.

18
3.1.2. Vùng tần số formant của các nguyên âm
Trong phần này, nghiên cứu của chúng tôi tập trung vào những ảnh
hưởng của các phụ âm vô thanh đối với vùng tần số formant của các nguyên
âm kế cận. Chẳng hạn, các âm tắc vô thanh /p, t, k/ bắt đầu bằng một luồng
hơi thở ra từ phổi sinh ra một cao độ thấp hơn chi phối đến các nguyên âm
đứng sau.
Qua dữ liệu khảo sát cho thấy, trong âm tiết CV ranh giới giữa âm vị /p,
t, k/ với nguyên âm theo sau có sự thay đổi rõ ràng, sự thay đổi này không chỉ
xảy ra ở vùng tần số chuyển tiếp giữa phụ âm và nguyên âm mà ngay cả trên
biểu đồ sóng và biên độ cũng có sự thay đổi rõ rệt. Biên độ của nguyên âm đi
sau tăng lên rất mạnh. Trên biểu đồ phổ, các formant của nguyên âm có độ
đậm rõ ràng hơn rất nhiều, tuy nhiên sự thay đổi trên biểu đồ phổ xảy ra chậm
hơn so với trên biểu đồ sóng trong khoảng thời gian 5-10ms. Phụ âm đầu /p, t,
k/ có ảnh hưởng đến vùng tần số formant của nguyên âm đứng sau, nó làm
suy giảm vùng tần số formant của nguyên âm, đặc biệt ở những vùng tần số
thấp như F1 và F2. Có thể khái quát vùng tần số formant của nguyên âm khi
kết hợp với các phụ âm tắc vô thanh qua bảng sau:
Vùng tần số trung bình formant nguyên âm (Hz)
Nguyê Ngữ cảnh CV
Ngữ cảnh V
n âm /p/ /t/ /k/
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 306 2397 3221 357 2717 3362 312 2228 3368 363 2882 3562
/e/ 516 2339 3065 488 2312 3426 501 2251 3373 520 2425 3444
// 583 2180 3056 639 2369 3425 664 2526 3424 680 2575 3440
// 316 1217 2745 304 1305 3429 309 1120 3339 352 1300 3508
// 448 1209 2614 505 1193 3210 533 1295 3442 551 1215 3569
/a/ 519 1664 2503 846 1805 3185 695 1744 2954 865 1915 3281
/u/ 329 748 2624 325 715 3402 324 602 3139 331 750 3442
/o/ 454 809 2903 458 869 3112 430 783 3158 503 878 2973

19
// 522 1132 2447 569 1186 2179 643 1113 2761 664 1290 2810

Bảng 3.2: Vùng tần số trung bình formant nguyên âm CTV nữ

Nguyên Vùng tần số trung bình formant nguyên âm (Hz)


âm Ngữ cảnh CV Ngữ cảnh V
/p/ /t/ /k/
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 312 2027 3130 310 2221 2940 336 2291 2895 319 2399 3177
/e/ 404 1895 2848 412 1946 2749 411 2243 2808 414 2135 2804
// 435 1955 2636 605 2080 2723 598 2263 2752 608 2281 2796
// 386 1246 2745 338 1255 2762 319 1314 2831 386 1269 2913
// 448 1242 2614 407 1276 2631 432 1335 2661 454 1291 2657
/a/ 519 1664 2503 923 1652 2700 691 1798 2874 967 1752 2819
/u/ 384 961 3057 399 1126 2658 456 2120 3212 468 2088 3201
/o/ 434 1109 2993 478 1065 2619 440 928 2796 636 1501 2965
// 586 1122 2447 653 1080 2392 726 1153 2587 817 1124 2775
Bảng 3.3: Vùng tần số trung bình formant nguyên âm CTV nam
Kết quả nghiên cứu cho thấy, khu vực tần số của một phụ âm đều được
điều chỉnh triệt để theo các formant của các nguyên âm đi sau, ảnh phổ vùng
tần số xuất hiện của /p, t, k/ trước các nguyên âm /i, e, u, o,  có
một tâm vùng thấp hơn kéo tâm vùng của các nguyên âm gần hơn với tâm
vùng của /p, t, k/ hơn so với trường hợp các nguyên âm độc lập. Tâm vùng
thấp và gần hơn với tâm vùng của /p, t, k/ được thể hiện rõ nhất ở đoạn
chuyển tiếp formant tiếp giáp giữa phụ âm tắc và nguyên âm nhất là đối với
các nguyên âm có độ mở rộng /, a, / vùng tần số F1 bị suy giảm đáng kể.

20
i e    a u o 

Biểu đồ 3.2: Vùng phân bố tần số formant của nguyên âm trong kết hợp
với /p, t, k/ CTV nữ

i e    a u o 

Biểu đồ 3.3: Vùng phân bố tần số formant của nguyên âm trong kết hợp với
/p, t, k/ CTV nam
Các lí do của việc nhóm phụ âm đầu tắc /p, t, k/ chi phối đối với tần số
formant của các nguyên âm kế cận hiện vẫn chưa được lí giải một cách thấu

21
đáo. Một học thuyết cho rằng thanh quản thường thấp hơn ở các âm tắc hữu
thanh, để mở rộng thể tích họng và duy trì áp suất biến thanh hầu đủ để tiếp
tục sinh âm trong suốt quá trình nghẽn; hoạt động hạ thấp này tạo ra vùng tần
số thấp hơn. Ngược lại, thanh quản vẫn cao hơn đối với các âm tắc vô thanh.
Một học thuyết khác cho rằng độ căng dây thanh trong một phụ âm tắc vô
thanh có thể ảnh hưởng đến vùng tần số ngay tại điểm đầu của sinh âm trong
nguyên âm. Các nghiên cứu về hoạt động của cơ cũng chỉ ra rằng các lực
căng cơ trong thanh quản có liên quan mật thiết với âm tắc hữu thanh. Nhìn
chung chưa có một giải thích nào thực sự thoả đáng đối với những ảnh hưởng
xáo trộn cao độ tần số của các âm tắc đứng trước âm nguyên âm tính, đặc biệt
là dưới ánh sáng của một thực tế là các âm tắc khi đứng sau âm nguyên âm
tính có những ảnh hưởng yếu hơn và kém bền vững hơn.

3.1.3. Diễn tiến vùng chuyển tiếp tần số formant


Ở những chỗ chuyển tiếp giữa phụ âm và nguyên âm trong cùng một
âm tiết các formants có đường nét chúc lên hay chúc xuống do những chuyển
đổi tư thế của các khí quan phát âm. Chính những nét này là các dấu hiệu để
nhận diện các phụ âm. Cụ thể, ở những mẫu nguyên âm đứng sau phụ âm
đầu /p, t, k/ chuyển tiếp CV thường ổn định, và rất dễ dàng nhận thấy ranh
giới giữa C và V. V tại đoạn chuyển tiếp phụ thuộc chặt chẽ vào các đặc trưng
của C, trong khoảng thời gian 50 – 60 ms đầu tiên F1 bắt đầu ở tần số thấp
hơn tần số trung bình của nguyên âm khoảng 50Hz, đi xuống đều đặn và có
tần số thấp nhất tại điểm cuối cùng của đường nét formant của nguyên âm.
Đối với F2, ở những nguyên âm dòng trước /i, e, / F2 bắt đầu với tần
số thấp có xu hướng đi lên, F2 của các nguyên âm còn lại đi xuống đều đặn.
Khái quát các mô hình chuyển tiếp formant của phụ âm /p, t, k/ với các
nguyên âm như sau:

22
Cụ thể, đường nét diễn tiến chuyển tiếp của phụ âm /p/ đối với formant của
nguyên âm được mô tả như sau: kết hợp với nguyên âm /i/, trong khoảng
20ms đầu, tần số của nguyên âm /i/ bị kéo xuống thấp nhất 277Hz sau đó có
diễn tiến đều đặn và ổn định ở vùng tần số 350-360Hz, F2 xuất phát ở vùng
tần số thấp 1974Hz có xu hướng hơn đi lên 2078Hz và giữ ổn định ở vùng tần
số này. Xu hướng diễn tiến này diễn ra ở cả tất cả các nguyên âm khác. Cấu
trúc formant là những điểm liền nhau không hề bị phá vỡ.

pi pê pe pư pơ pa pu pô po

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /p/
Diễn tiến chuyển tiếp của phụ âm /t/ đối với formant của nguyên âm
được mô tả như sau: kết hợp với nguyên âm /i/, trong khoảng 15ms đầu, tần
số F1 của nguyên âm /i/ có diễn tiến đều đặn và ổn định ở vùng tần số trên
300Hz, F2 xuất phát ở vùng tần số cao 2035Hz có xu hướng hơn đi xuống đều
1744Hz và giữ ổn định ở vùng tần số này. Xu hướng diễn tiến này diễn ra ở cả
tất cả các nguyên âm khác.

ti tê te tư tơ ta tu tô to
Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /t/
Trong kết hợp phụ âm /k/ ở đầu, ở tất cả các nguyên âm diễn tiến F1 không có
sự thay đổi nhiều về tần số, đường nét F1 bằng phẳng và đều đặn từ đầu đến

23
cuối, diễn tiến này có ở tất cả các nguyên âm. Đối với cấu trúc F2 ở đoạn đầu
có điểm xuất phát ở tần số cao, có xu hướng đi xuống tạo thành đường cong
formant sau đó có diễn tiến ổn định.

ki kê ke cư cơ ca cu cô co

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /k/
3.2. Formant của nguyên âm trong kết hợp với âm đầu /m ,n, /
Tất cả các âm mũi /m, n, ŋ/ có cấu âm phụ thuộc vào luồng hơi đi qua
khoang họng và khoang miệng, ví dụ âm /m/ của từ ma hay mi. Các phụ âm
mũi kiểu như vậy được tạo ra với ngạc mềm hạ thấp xuống để cho luồng hơi
đi qua đường mũi, và với khoang miệng bị ngăn chặn trong suốt khoảng thời
gian phát âm phụ âm. Trong hoạt động này, khoang họng và khoang mũi mở
và khoang miệng đóng tất cả đều tham gia vào các thuộc tính cộng hưởng của
âm. Chẳng hạn như [m, n, ] như trong từ mê, nê và âm đầu của từ nga, mạc
hay ngạc mềm được hạ thấp nhưng lại có một động tác khép hoàn toàn ở
miệng (ở hai môi đối với [m], giữa đầu lưỡi và răng hay chân răng đối với [n],
giữa phần sau lưỡi và ngạc mềm (mạc) đối với []). Kết quả là toàn bộ không
khí được dùng trong hoạt động tạo sản của chúng bị đổi qua mũi.
Cấu âm của phụ âm mũi hữu thanh thể hiện bằng một dải sóng hữu
thanh dài có biên độ và tần số thấp hơn tần số hữu thanh của nguyên âm, năng
lượng tần số là các khoảng đậm nhạt yếu hơn ở khu vực nguyên âm. Đặc
điểm của sóng âm và ảnh phổ được miêu tả và minh hoạ như sau:

24
Hình 3.3: Ảnh phổ minh họa vùng năng lượng tần số của /m/ trong so sánh
với /e/
Ảnh trên cho thấy, âm vị /m/ là phụ âm tắc, không bật hơi, hữu thanh.
Trên biểu đồ phổ, sự xuất hiện của âm vị /m/ được nhận biết bằng sự chuyển
động đột ngột từ thời điểm không có hoặc rất ít năng lượng sang một sự đột
biến của năng lượng trên một khoảng rộng tần số trong một khoảng thời gian
dài mà ta thường thấy như một cột dựng đứng. Trên biểu đồ sóng, âm vị /m/
thường chỉ bao gồm vài xung tuần hoàn có biên độ thấp. Ranh giới giữa âm vị
/m/ với hữu thanh đằng trước và nguyên âm đằng sau dễ dàng được xác định
bằng sự thay đổi về biên độ và tần số trên biểu đồ sóng và biểu đồ phổ.
Ranh giới giữa âm mũi và các nguyên âm được nhận thấy trên biểu đồ
phổ bằng việc sự xuất hiện của các formant. Kết cấu formant của các phụ âm
mũi về cơ bản giống với kết cấu formant của các nguyên âm. Tuy nhiên, hình
dạng ba formant đầu tiên của chúng thường khác với hình dạng formant của
một nguyên âm bởi sự chuyển động đều đặn ổn định và có phần đi lên rất đột
ngột của hầu hết các formant là do trường độ tăng cường của hệ thống khoang

25
cộng hưởng trong thế so sánh với trường độ tăng cường của các nguyên âm
bên cạnh. Cường độ tổng thể của tất cả các âm mũi là thấp hơn đáng kể so với
cường độ tổng thể của các nguyên âm. Đoạn chuyển tiếp formant của phụ
âm /m/ sang nguyên âm có trường độ nằm trong khoảng 50 ms vùng mà tần
số formant có sự thay đổi mạnh mẽ.
Điểm kết thúc của âm vị /e/ được xác định trên biểu đồ sóng. Âm /e/ là
nguyên âm, tại điểm kết thúc các sóng đi lên hoặc đi xuống chu kỳ đều đặn
với biên độ giảm dần. Trên biểu đồ phổ có thể nhận thấy rất rõ các formant
F1, F2, F3 của âm vị /e/. Các phụ âm mũi /n/, /m/ có năng lượng thấp nhất
trong các loại âm vị, do đó formant của hai âm này mờ nhạt hơn nguyên âm
/e/. Các F2, F3 của hai phụ âm /n/, /m/ ở đoạn tiếp giáp với /e/ thường có
cùng độ cao và song song với F2, F3 của /e/ do bị ảnh hưởng của các formant
này.

3.2.1. Trường độ formant của nguyên âm


Trường độ formant của nguyên âm đi sau phụ âm tắc hữu thanh thường
dài hơn đáng kể so với nguyên âm đứng sau các phụ âm tắc vô thanh tuy
nhiên chúng vẫn ngắn hơn so với nguyên âm trong ngữ cảnh độc lập: so sánh
mi và ti; nga và ca; nguyên âm trong kết hợp phụ âm và nguyên âm trong ngữ
cảnh độc lập:
Nguyên Trường độ formant nguyên âm (ms)
âm Ngữ cảnh CV Ngữ cảnh V
/m/ /n/ //
/i/ 333 338 324 348
/e/ 347 352 331 353
// 346 321 316 346
// 345 347 321 354
// 312 300 319 363

26
/a/ 350 301 313 351
/u/ 363 345 325 371
/o/ 353 320 317 364
// 361 322 303 367

Bảng 3.4: Trường độ formant của nguyên âm

Biểu đồ 3.4: Trường độ formant của nguyên âm trong kết hợp /m, n, /

3.2.2. Vùng tần số formant


Trong phần này nghiên cứu của chúng tôi tập trung vào những ảnh
hưởng của các phụ âm mũi hữu thanh đối với cao độ của các nguyên âm kế
cận.
Nguyên Vùng tần số trung bình formant nguyên âm (Hz)
âm Ngữ cảnh CV Ngữ cảnh V
/m/ /n/ //

27
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 348 2133 3027 317 2632 3383 320 2121 3152 413 2902 3500
/e/ 502 1979 2659 468 2169 2746 492 2323 3025 557 2169 2818
// 697 2376 3131 593 1935 2894 632 2340 3117 704 2559 3466
// 378 1386 2860 363 1597 3076 346 1359 2668 429 1328 3394
// 629 1406 3090 537 1556 3221 670 1383 3193 651 1411 3366
/a/ 796 1666 2262 738 2032 3069 778 2021 3240 865 1915 3281
/u/ 364 951 3127 344 970 3078 450 757 2759 399 672 3222
/o/ 346 953 2949 578 1087 3342 460 848 3172 503 1501 2965
// 538 1089 2482 811 1241 2865 760 1239 3409 664 1305 2901

Bảng 3.5: Vùng tần số trung bình formant nguyên âm CTV nữ

Nguyên Vùng tần số trung bình formant nguyên âm (Hz)


âm Ngữ cảnh CV Ngữ cảnh V
/m/ /n/ //
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 281 1897 3081 312 2242 3480 336 2213 3656 319 2399 3177
/e/ 345 1736 2816 393 2199 3065 385 2163 3143 414 2135 2804
// 401 1792 2700 427 2040 3197 429 2254 3461 608 2281 2796
// 348 1377 2824 372 1184 3142 387 1711 3268 386 1269 2913
// 343 1119 2644 427 1242 2754 500 1560 3187 454 1291 2657
/a/ 426 1425 2175 519 1662 2856 565 1928 3204 967 1752 2819
/u/ 338 1013 2750 454 1383 3331 423 1140 3186 468 2088 3201
/o/ 365 1121 2837 487 1213 3294 486 1009 3190 636 1501 2965
// 440 1119 2704 609 1061 3311 597 1243 3264 817 1124 2775

Bảng 3.6: Vùng tần số trung bình formant nguyên âm CTV nam

28
i e    a u o 

Biểu đồ 3.5: Vùng phân bố tần số formant của nguyên âm trong kết hợp
với /m,n,/ CTV nam

i e    a u o 

Biểu đồ 3.6: Vùng phân bố tần số formant của nguyên âm trong kết hợp
với /m, n, / CTV nữ

29
Các âm mũi hữu thanh có xu hướng hạ thấp cao độ của tần số formant
của các nguyên âm đi sau hơn so với các âm tắc vô thanh. Trong trường hợp
các âm tắc thở, điều này được coi là do các lực căng cơ thanh quản trong phía
dưới dùng trong sinh âm thở. Các âm hút vào hạ thấp cao độ ít hơn so với các
âm tắc hữu thanh bình thường, có thể một phần vì lí do luồng hơi ở hầu
chuyển động nhanh khi thanh quản hạ thấp xuống trong suốt quá trình hút hơi
vào. Cũng có thể là các lực căng cơ cần để khép khe thanh lại trong suốt quá
trình hút hơi chống lại các yếu tố có khuynh hướng hạ thấp cao độ ở nguyên
âm đứng sau.
Ở các phụ âm, nét đặc được hiển thị bằng một vùng formant trội, đặt tại
trung tâm, như đối lập với những âm vị mà trong đó một vùng không phải
trung tâm trội lên. Các âm mũi đặc có một vùng formant trội giữa các formant
mũi đặc trưng (200 cps và 2500 cps). Những quan sát về những vị trí của
formant thứ nhất ở các âm tắc và các âm mũi làm minh chứng cho mối quan
hệ song song giữa nét đặc ở các nguyên âm và phụ âm.

3.2.3. Diễn tiến vùng chuyển tiếp tần số formant


Các phụ âm đầu /m, n, / trong kết hợp với nguyên âm đều có ảnh
hưởng tới diễn tiến formant của nguyên âm. Tuy nhiên sự ảnh hưởng của từng
phụ âm tới formant là khác nhau. Đặc trưng của vùng ảnh hưởng formant của
phụ âm /m/ đến nguyên âm đứng sau chính là sự gia tăng tần số ở cả F1 và
F2. Cụ thể lần lượt là /i/ bắt đầu ở vùng tần số F1 229Hz gia tăng đến tần số
386Hz sau đó có diễn tiến đều đặn. Vùng tần số F2 cũng có sự gia tăng mạnh
mẽ từ xuất phát điểm rất thấp 1259Hz diễn tiến có chiều đi lên đột ngột, đạt
tần số cao nhất 2351Hz sau đó có diễn tiến ổn định đều đặn từ đầu đến cuối.
Cấu trúc formant của /m/ tại đoạn chuyển tiếp với nguyên âm bị đứt đoạn.
Trường độ đoạn chuyển tiếp nằm trong khoảng 30 đến 50ms; các nguyên

30
âm /e/ F1 235-423Hz, F2 1293-2406Hz; // F1 241-450Hz, F2 1130-
2204Hz; // F1 234-385Hz, F2 1207-2434Hz; // F1 225-430; F2 1075-
1302; /a/ F1 225-514Hz, F2 1093-1708Hz. Các nguyên âm dòng sau /u/;
/o/; // cũng có diễn tiến tương tự. Có thể khái quát mô hình chuyển tiếp
formant trong kết hợp với phụ âm đầu /m/ minh họa dưới đây:

mi mê me mư mơ ma mu mô mo

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /m/

Nếu như sự ảnh hưởng formant nguyên âm đứng trước phụ âm /m/ là sự
suy giảm về tần số của cả F1 và F2 thì diễn tiến formant của nguyên âm đứng
trước phụ âm /n/ bị ảnh hưởng theo hai chiều khác nhau, sự suy giảm ổn định
của tần số F1, và sự gia tăng của tần số F2 là diễn tiến cơ bản chi phối toàn bộ
làm nên đặc trưng diễn tiến formant của nguyên âm trong kết hợp với phụ
âm /n/ cuối. Điều này đúng cho cả CTV nam và CTV nữ. Xu hướng và diễn
tiến này diễn ra ở tất cả các nguyên âm.
Cụ thể: vùng duy trì ổn định tần số F1 của /i/ bắt đầu ở vùng tần số 366 Hz
có diễn tiến bằng phẳng đều đặn đến hết phần nguyên âm qua đoạn chuyển
tiếp tần số có xu hướng giảm đều và kết thúc ở tần số thấp hơn; tần số F2 bắt
đầu từ tần số 2174Hz có diễn tiến đều đặn ở đoạn đầu và càng gần đoạn
chuyển tiếp sự gia tăng tần số diễn ra mạnh mẽ đến và kết thúc ở vùng tần số
cao nhất là 2578Hz. Đối với nguyên âm /e/, F1 duy trì ở tần số trên 400 Hz
đến gần đoạn chuyển tiếp tần số suy giảm từ từ xuống dưới 300Hz. F2 có
chiều hướng ngược lại, vùng tần số ổn định đến gần đoạn chuyển tiếp sau đó

31
có xu hướng gia tăng đến tần số 2737Hz, một phần cấu trúc F2 của /e/ bị phá
vỡ thành các điểm rời rạc ở đoạn cuối. Diễn tiến đường nét cũng xảy ra tương
tự đối với các nguyên âm /, , , a, u, o,/. Có thể khái quát mô hình chuyển
tiếp formant của 9 nguyên âm đơn tiếng Việt trong kết hợp với âm /n/ cuối
theo mô hình diễn tiến sau:

ni nê ne nư nơ na nu nô no

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /n/

nghi nghê nghe ngư ngơ nga ngu ngô ngo

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /ŋ/
3.3. Thảo luận
Thảo luận của chúng tôi ở đây đi theo hầu hết các nhà nghiên cứu tập
trung vào một vài formant với tư cách như là các yếu tố xác định về mặt âm
học của đặc điểm nguyên âm. Nhưng Strange et al. (1983) đã tranh luận một
cách đầy thuyết phục là khi người nghe tiếp nhận các nguyên âm của lời nói
tự nhiên, đối lập với các kích thích tổng hợp trong phòng thí nghiệm, họ cũng
phụ thuộc vào những thông tin chuyển tiếp liên cấu âm động học trong cấu
trúc formant của âm tiết. Trong khi điều này vẫn đang còn là một vấn đề thách

32
đố đối với một số nhà nghiên cứu, thì trên thực tế rất có thể là người nghe,
trong các tình huống bình thường, có các thông tin phụ theo cách này.
Những nghiên cứu của tập đoàn Haskins sử dụng các bản ghi phổ màu
để tổng hợp các kích thích đã cung cấp bằng chứng cơ bản về các tín hiệu âm
học chính đối với vị trí phát âm ở các âm tắc, và đối với nét khu biệt hữu
thanh - vô thanh. Hoạt động nghiên cứu sâu tại Haskins và ở nhiều nơi khác
bằng phương pháp sử dụng lời nói tổng hợp đã cho những hiểu biết chi tiết về
hầu hết các đặc trưng âm học của các phụ âm. Hoạt động này bao gồm cả khái
niệm quỹ tích formant, và vai trò của việc thổi tiếng ồn với tư cách như là các
dấu hiệu đối với phát âm hữu thanh và vị trí cấu âm ở các âm tắc. Vai trò của
phổ thổi tiếng ồn và mối quan hệ liên cấu âm của nó với nguyên âm đứng sau
trong các âm tiết kiểu CV, trong tư liệu nổi tiếng của Cooper et al. (1952).
Hoạt động nghiên cứu của tập thể phòng thí nghiệm Haskins cũng đã chỉ ra
rằng các chuyển tiếp và tỉ lệ thay đổi của các chuyển tiếp formant ở đầu và ở
cuối một âm tiết đã có một vai trò quan trọng trong việc phân biệt các âm tắc
với các phụ âm vang trong việc xác định các âm mũi và các âm tắc (Liberman
et al. 1954). Harris (1958) cũng đã chỉ ra rằng cấu trúc phổ của tiếng ồn trong
các âm xát là một dấu hiệu cơ bản đối với việc tiếp nhận chúng.
Kể từ hoạt động nghiên cứu đầu tiên này, công nghệ tổng hợp và phân
tích tiếng nói đã phức tạp, chính xác và linh hoạt hơn nhiều, và hiện nay có rất
nhiều tài liệu về các dấu hiệu âm học đối với hàng loạt các phụ âm. Nhìn
chung, những công trình nghiên cứu này phù hợp với các thuộc tính âm học
phụ âm được mô tả theo quan điểm tạo sản.
3.4. Tiểu kết
Tất cả các phụ âm đầu trong kết hợp với nguyên âm đều có ảnh hưởng
tới trường độ formant, vùng tần số formant và diễn tiến formant của nguyên

33
âm. Sự ảnh hưởng của từng nhóm phụ âm với những phương thức và vị trí
cấu âm của phụ âm đến formant là khác nhau.
Nhìn chung, sự ảnh hưởng của chúng đối với tần số F1 là không đáng
kể: F1 hầu như ít thay đổi và tương đối ổn định. Ngược lại do ảnh hưởng của
phụ âm đầu, formant của nguyên âm trong kết hợp với những phụ âm môi /m,
p/ F2 có chiều hướng bị “kéo” thấp xuống, rồi sau đó có diễn tiến đều đặn ổn
định. Ngược lại, kết hợp với các phụ âm lưỡi, răng /t, n/ và lưỡi, mạc /k, ŋ/
formant của nguyên âm có xuất phát điểm ở vùng tần số cao, có diễn tiến đi
xuống và ổn định. Ở /k, ŋ/ xuất phát điểm cao hơn tạo đường cong formant
dốc hơn so với /t, n/.
Yếu tố thanh tính của phụ âm đầu cũng chi phối thời gian diễn ra biến
đổi của F2 và cả F3: ở các phụ âm tắc vô thanh, biến đổi của F2 và F3 diễn ra
trong thời gian ngắn hơn (khoảng 20ms - 30ms); ở phụ âm tắc hữu thanh thì
quá trình này diễn ra dài hơn (khoảng 50-80 ms).
Trường độ của phụ âm cũng là yếu tố ảnh hưởng đến diễn tiến của F1,
F2. Trường độ phụ âm đầu càng dài như ở các phụ âm /m, n, ŋ/ thì giai đoạn
diễn tiến của F1, F2 từ tần số thấp đến tần số ổn định càng rõ ràng và kéo dài.
Mô hình tổng quát cho việc tổng hợp và nhận dạng các phụ âm đầu với vị trí
cấu âm và phương thức cấu âm khác nhau được khái quát như sau:

ma na a

pa ta ka

34
CHƯƠNG 4: FORMANT CỦA NGUYÊN ÂM
TRONG KẾT HỢP VỚI ÂM CUỐI

Trong phần vần, âm chính và âm cuối có mối quan hệ rất chặt chẽ với
nhau. Sự biến đổi của âm chính bao giờ cũng kéo theo sự thay đổi của âm
cuối và ngược lại. Trong chương này, luận án đi vào tìm hiểu sự ảnh hưởng
của nhóm phụ âm cuối /p, t, k/, nhóm phụ âm /m, n, ŋ/ tới cấu trúc formant
của nguyên âm trên 3 phương diện: 1) Trường độ, 2) Vùng tần số; và 3) Diễn
tiến đường nét. Để xem xét sự tác động của nhóm phụ âm cuối tắc /p, t, k/ lên
nguyên âm có khác gì so với nhóm phụ âm cuối mũi /m, n, /. Bên cạnh đó, so
sánh sự khác biệt cấu trúc formant của nguyên âm trong kết hợp âm tắc đầu
và tắc cuối với một ngôn ngữ khác chỉ ra sự khác biệt riêng vốn có và đặc
trưng của tiếng Việt. Nội dung chương được trình bày làm hai tiểu mục:
Formant của nguyên âm trong kết hợp với âm cuối /p, t, k/ và Formant của
nguyên âm trong kết hợp với âm cuối /m, n, /.
4.1. Formant của nguyên âm trong kết hợp âm cuối /p, t, k/
Xét về phương thức cấu âm nhóm phụ âm cuối /p, t, k/ là các âm tắc,
ồn, vô thanh. Các âm kết thúc bằng /p, t, k/ được phát âm bị tắt đột ngột do
động tác khép lại của bộ máy phát âm, lối thoát của không khí không được
khai thông trở lại sau khi bị cản trở như trường hợp phát âm các phụ âm khác
bằng một động tác mở ra, kèm theo một tiếng động đặc thù. Bộ phận cuối của
âm tiết bị vô thanh hóa. Âm hưởng của cả âm tiết bị câm đi, bị điếc đi khiến
cho phần hữu thanh của nguyên âm ở đầu bị ảnh hưởng.
Xét về vị trí cấu âm môi - lưỡi các âm cuối /p/ là âm môi, /t, k/ là các
âm lưỡi, trong đó /t/ là âm đầu lưỡi, /k/ là âm mặt lưỡi; vị trí cấu âm và
phương thức cấu âm bị chi phối bởi sự ảnh hưởng của nguyên âm đứng trước.

35
Hình 4.1: Hình ảnh minh họa âm cuối /t/ trong âm tiết "ót"

Nhìn trên ảnh phổ và ảnh sóng có thể thấy những âm tiết kết thúc bằng
phụ âm tắc /p, t, k/ thì độ dài trung bình của âm cuối đóng /t/ có trường độ dài
hơn (20-50ms) so với vị trí đầu âm tiết (10-16ms). Âm tắc thường được nhận
dạng trên biểu đồ sóng là đoạn năng lượng ở cuối âm tiết, khi các F1, F2 của
nguyên âm đã hết. Đôi khi trên biểu đồ sóng âm tắc /p, t, k/ kéo dài khoảng
20-50 ms bao gồm vài xung có biên độ thấp không tuần hoàn.

4.1.1. Trường độ formant của nguyên âm


Nếu như trường độ formant của nguyên âm trong kết hợp CV phụ
thuộc vào kết hợp thanh điệu và có sự cách biệt tương đối lớn giữa các kết
hợp thanh khác nhau thì ngược lại sự kết thúc của phụ âm cuối /p, t, k, m, n,
ŋ/ khiến trường độ formant của nguyên âm trong kết hợp VC rất ngắn và
không có sự cách biệt quá lớn giữa các kết hợp thanh điệu. So sánh kết quả
thu được khi đo trường độ nguyên âm trong kết hợp âm cuối /p, t, k/ với
trường độ nguyên âm trong ngữ cảnh độc lập có thể dễ dàng nhận thấy trường
độ các nguyên âm đều bị biến đổi. Sự biến đổi này khiến trường độ nguyên
âm có diễn tiến ngắn hơn rất nhiều, thường thì trường độ chỉ bằng khoảng 1/3

36
đến 1/2 so với trường độ nguyên âm trong ngữ cảnh độc lập - khi không có
kết hợp với phụ âm đằng trước và sau. Điều này đúng với cả người nói là nam
và nữ, cụ thể như sau:
Nguyên Trường độ formant nguyên âm (ms)
âm Ngữ cảnh VC Ngữ cảnh V

/p/ /t/ /k/


/i/ 131 113 72 363
/e/ 114 126 72 324
// 143 107 141 352
// 102 76 70 328
// 123 123 139 333
/a/ 142 126 136 317
/u/ 110 94 83 333
/o/ 129 125 80 331
// 140 113 88 363

Bảng 4.1: Trường độ nguyên âm trong ngữ cảnh VC CTV nam

37
Biểu đồ 4.1. Trường độ formant nguyên âm trong ngữ cảnh VC CTV nam

Nguyên Trường độ formant nguyên âm (ms)


âm Ngữ cảnh VC Ngữ cảnh V

/p/ /t/ /k/


/i/ 122 126 114 328
/e/ 137 138 134 353
// 138 155 174 346
// 163 126 90 354
// 182 139 164 363
/a/ 157 150 151 351
/u/ 151 131 98 371
/o/ 162 120 99 364
// 165 119 87 367

Bảng 4.2: Trường độ nguyên âm trong ngữ cảnh VC CTV nữ


Có sự khác nhau về trường độ giữa các người nói (nam, nữ), giữa các
nhóm nguyên âm, giữa nguyên âm trong kết hợp với các nhóm phụ âm cuối,

ĐỘ GIẢM CỦA TRƯỜNG ĐỘ (ms)
/p/ /t/ /k/
Nam Nữ Nam Nữ Nam Nữ
/i/ 232 206 250 202 291 214
/e/ 210 216 198 215 252 219
// 209 208 245 191 211 172
// 226 191 252 228 258 264
// 210 181 210 224 194 199
/a/ 175 194 191 201 181 200
/u/ 223 220 239 240 250 273
/o/ 202 202 206 244 251 265
// 223 202 250 248 275 280

Bảng 4.3: Độ giảm của trường độ trong ngữ cảnh VC

38
Trong kết hợp với ba âm /p, t, k/, trường độ các nguyên âm giảm nhiều
nhất trong kết hợp với phụ âm cuối /k/, tiếp đến là /t/ và cuối cùng là /p/.
Đối với cộng tác viên nam, trong kết hợp với âm cuối /p, t, k/, trường
độ nguyên âm /i/ giảm nhiều nhất (lần lượt là 232ms – 250ms – 291ms),
trường độ của nguyên âm /a/ giảm ít nhất (175ms – 191ms – 181ms).
Đối với cộng tác viên nữ, trong kết hợp với âm cuối /p/, trường độ
nguyên âm /u/ giảm nhiều nhất (220ms), // giảm ít nhất (181ms). Trong kết
hợp với âm cuối /t/, trường độ của nguyên âm // giảm nhiều nhất (248ms), //
giảm ít nhất (191ms). Còn trong kết hợp với âm cuối /k/, trường độ nguyên
âm // giảm nhiều nhất (280ms), // giảm ít nhất (172ms). CTV nữ có trường
độ phát âm dài hơn so với các CTV nam.

4.1.2. Vùng tần số formant


Khi đóng vai trò kết thúc âm tiết các âm tắc đứng sau nguyên âm chúng
đã làm biến đổi âm sắc của nguyên âm ở giai đoạn cuối. Sự chuyển dịch
formant theo các hướng khác nhau phụ thuộc vào kết hợp của từng phụ âm,
đây cũng là dấu hiệu quan trọng duy nhất có thể nhận diện ra các âm cuối. Cụ
thể, một âm tắc /k/ hoặc /p/ có thể làm tăng cao độ và biến đổi đường nét cấu
trúc formant của nguyên âm đứng trước. Có thể khái quát vùng tần số formant
của nguyên âm khi kết hợp với các phụ âm cuối qua bảng sau:
Nguyên Vùng tần số trung bình formant nguyên âm (Hz)
âm Ngữ cảnh VC Ngữ cảnh V
/p/ /t/ /k/
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 330 1996 2892 319 2085 3136 368 1873 3004 319 2399 3177
/e/ 445 1868 2627 438 1911 2706 416 1936 3013 414 2135 2804
// 463 1799 2476 430 1850 2553 393 1863 2715 608 2281 2796
// 369 1543 2425 368 1476 2595 422 1167 2552 386 1269 2913

39
// 452 1233 2469 464 1241 2693 656 1234 2548 454 1291 2657
/a/ 1012 1745 2823 463 1573 2327 987 1845 2806 967 1752 2819
/u/ 385 771 2562 383 1004 2792 424 1530 2976 468 2088 3201
/o/ 454 965 2820 397 949 2708 469 1057 2731 437 815 2795
// 529 1036 2615 448 1095 2500 558 1118 2456 817 1124 2775

Bảng 4.4: Vùng tần số formant của nguyên âm trong kết hợp với /p, t, k/ CTV Nam

40
Nguyên Vùng tần số trung bình formant nguyên âm (Hz)
âm Ngữ cảnh VC Ngữ cảnh V
/p/ /t/ /k/
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 373 2735 3464 363 2697 3305 441 2424 3005 413 2902 3500
/e/ 667 2334 3036 461 2456 3028 719 2155 3117 557 2169 2818
// 780 2025 2803 747 2463 3228 730 1985 3068 704 2559 3466
// 461 1275 2828 448 1268 2877 463 1335 2751 429 1328 3394
// 591 1300 2704 556 1386 2777 599 1312 2798 651 1411 3366
/a/ 100 1847 2845 1106 1500 2108 966 1774 2922 865 1915 3281
2
/u/ 420 878 2921 404 865 2878 442 901 2782 399 672 3222
/o/ 568 985 2966 477 1018 2933 669 1203 2882 503 878 2973
// 956 1334 2834 897 1346 2695 944 1363 2785 664 1290 2810

Bảng 4.5: Vùng tần số formant của nguyên âm trong kết hợp với /p, t, k/ CTV nữ

i e    a u o 

Biểu đồ 4.2: Vùng tần số formant của nguyên âm trong kết hợp /p, t, k/ CTV nam

41
i e    a u o 

Biểu đồ 4.3: Vùng phân bố tần số formant của nguyên âm trong trong kết hợp
/p, t, k/ CTV nữ

4.1.3. Diễn tiến vùng chuyển tiếp tần số formant


Âm tắc cuối /p, t,k/ có ảnh hưởng mạnh mẽ tới cấu trúc formant của
nguyên âm trong cấu trúc VC. Diễn tiến vùng chuyển tiếp giữa VC rất mờ
nhạt, khó xác định ranh giới khiến C gần như bị hòa kết liền với V. Cấu trúc
và diễn tiến formant của nguyên âm trong đoạn chuyển tiếp bị thay đổi, tại
điểm kết thúc nguyên âm các sóng đi lên hoặc đi xuống với chu kỳ đều đặn
với biên độ giảm dần, và kết thúc đột ngột.
Diễn tiến formant của nguyên âm trong kết hợp với âm /t/ ở cuối có xu
hướng suy giảm ở tần số F1 và gia tăng ở vùng tần số F2. Phần đầu âm tiết
trên biểu đồ phổ có thể nhận thấy rất rõ các formant F1, F2 của các nguyên
âm trong vùng đặc trưng. Ở phần đầu nguyên âm /i/ có F1 411Hz sau đó vùng
tần số có xu hướng bị suy giảm đều đặn, formant có dạng đi xuống và kết
thúc ở tần số thấp 247Hz. Ngược lại, F2 bắt đầu ở tần số 2047Hz có diễn tiến

42
hơi đi lên ở cuối kết thúc ở tần số 2201Hz. Với nguyên âm khác /e, , , ə, a,
u, o, / diễn tiến formant cũng tương tự và lần lượt suy giảm ở F1và gia tăng
F2 là: /e/ F1 425-275Hz, F2 1951-2153Hz; // F1 545-252, F2 1976-
2129Hz; // F1 323-256Hz, F2 2085-2280; /ə/ F1562-272Hz, F2 1682-
1885; /a/ F1 713-250, F2 1683-1714Hz; /u/ F1 467-255Hz, F2 1955-
2538Hz; /o/ F1 558-292Hz, F2 1900-2773Hz; // F1 841-210, F2 2174-
2497Hz. Cấu trúc F2 của các nguyên âm dòng sau /u, o, / bị phá vỡ thành các
điểm rời rạc. Có thể mô hình hóa diễn tiến formant của nguyên âm trong kết
hợp với âm /t/ như sau:

it êt et ưt ơt at ut ôt ot

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /t/
Trong kết hợp với phụ âm /p/, phần nguyên âm hữu thanh nên sóng tuần
hoàn và biên độ lớn hơn âm /p/ bên cạnh. Ranh giới giữa nguyên âm và phụ
âm bên cạnh là sự thay đổi về biên độ và tần số sóng. Do nguyên âm có năng
lượng cao hơn phụ âm nên các formant rõ ràng hơn và ảnh hưởng đến phụ
âm, điểm chuyển hướng hay gãy của formants của nguyên âm trong kết hợp
với /p/ là hoàn toàn khác so với kết hợp với /t/. Cụ thể diễn tiến formant của
nguyên âm trong kết hợp với /p/ có diễn tiến suy giảm cả ở vùng tần số F1 và
F2. Ở vùng tần số F1 các nguyên âm bắt đầu với tần số đặc trưng cho từng
nguyên âm sau đó có diễn tiến đi xuống và kết thúc ở vùng tần số thấp trung

43
bình ở 250Hz. F2 cũng có diễn tiến đi xuống đếu đặn và tạo điểm gãy
formant ở gần vùng tiếp giáp với âm /p/.

Có thể mô hình hóa diễn tiến formant của nguyên âm trong kết hợp với
âm /p/ như sau:

ip êp ep ưp ơp ap up ôp op

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /p/
Diễn tiến formant của nguyên âm trong kết hợp với âm tắc /k/ có đường
nét gần giống với âm /t/, ở cuối có xu hướng suy giảm ở tần số F1 và gia tăng
ở vùng tần số F2. Tuy nhiên, sự gia tăng ở vùng tần số F2 diễn ra mạnh hơn
khiến diễn tiến đi lên F2 của các nguyên âm tăng cao hơn và kết thúc ở vùng
tần số F2 cao hơn rất nhiều so với vùng tần số F2 đặc trưng.
Có thể mô hình hóa diễn tiến formant của nguyên âm trong kết hợp với
âm /k/ như sau:

ich êch ec ưc ơc ac uc ôc oc
Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /k/
4.2. Formant của nguyên âm trong kết hợp âm cuối /m, n, /
Những phụ âm cuối mũi /m, n, / là các âm vang, hữu thanh chúng đều
có nét phụ âm tính lẫn nét nguyên âm tính: giống các nguyên âm, nhưng
chúng chỉ có một nguồn hoạ âm. Kết cấu formant của các âm mũi về cơ bản

44
giống với kết cấu formant của các nguyên âm. Quá trình hữu thanh diễn ra từ
đầu đến cuối, tuy nhiên, hình dạng của 3 formant đầu của chúng thường khác
với hình thể của một nguyên âm bởi sự chuyển động đi xuống rất đột ngột của
hầu hết các formant là do trường độ tăng cường của hệ thống khoang cộng
hưởng trong thế so sánh với trường độ tăng cường của các nguyên âm bên
cạnh. Cường độ tổng thể của tất cả các âm mũi là thấp hơn đáng kể so với
cường độ tổng thể của các nguyên âm.Về vị trí cấu âm môi - lưỡi các âm
cuối /m/ là âm môi, /n, ŋ/ là các âm lưỡi, trong đó /n/ là âm đầu lưỡi, /ŋ/ là âm
mặt lưỡi.

Hình 4.2: Hình ảnh minh họa âm cuối /m/


Các âm cuối /m/ là phụ âm mũi, vang. Trên biểu đồ phổ có thể nhận
thấy rất rõ các formant F1, F2, F3 của âm /e/. Các phụ âm mũi /m, n, / có
năng lượng thấp, do đó formant của các âm này mờ nhạt hơn nguyên âm. Các
F2, F3 của /m, n, / thường có dùng độ cao và song song với F2, F3 của
nguyên âm do bị ảnh hưởng của các formant này. Biểu đồ sóng của các phụ
âm này có biên độ thấp, tương đối tuần hoàn. Âm /e/ là nguyên âm, trên biểu
đồ sóng có biên độ cao hơn hẳn. Phần cuối của phụ âm /m/ dạng sóng tuần
hoàn giảm dần, kéo dài đến khi trùng với biên độ của noise.

45
4.2.1. Trường độ formant của nguyên âm

Nguyên Trường độ formant nguyên âm (ms)


âm Ngữ cảnh VC Ngữ cảnh
V
/m/ /n/ //
/i/ 120 128 97 363
/e/ 148 163 115 324
// 128 160 187 352
// 143 136 101 328
// 127 160 156 333
/a/ 155 185 173 317
/u/ 141 177 80 333
/o/ 133 158 102 331
// 134 168 99 363
Bảng 4.6: Trường độ của nguyên âm CTV nam

Biểu đồ 4.4: Trường độ formant nguyên âm trong ngữ cảnh VC CTV nam
Nguyên Trường độ formant nguyên âm (ms)
âm Ngữ cảnh VC Ngữ cảnh V
/m/ /n/ //
/i/ 145 162 148 328

46
/e/ 178 191 116 353
// 156 187 185 346
// 132 152 153 354
// 154 158 147 363
/a/ 164 190 168 351
/u/ 156 140 94 371
/o/ 137 180 109 364
// 168 174 115 367

Bảng 4.7: Trường độ của nguyên âm CTV nữ

4.2.2. Vùng tần số formant của nguyên âm


Nguyên Vùng tần số trung bình formant nguyên âm (Hz)
âm Ngữ cảnh VC Ngữ cảnh V
/m/ /n/ //
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 289 1903 2722 302 1777 2822 305 1705 2601 319 2399 3177
/e/ 362 1813 2535 519 1854 2800 387 1627 2421 414 2135 2804
// 515 1464 2458 714 2108 2862 583 1616 2524 608 2281 2796
// 316 1574 2436 388 1523 2764 313 1600 2510 386 1269 2913
// 381 1453 2475 467 1370 2818 362 1515 2602 454 1291 2657
/a/ 559 1484 2265 850 1762 2933 576 1479 2415 967 1752 2819
/u/ 330 1235 2512 377 1234 2749 315 1416 2581 468 2088 3201
/o/ 376 1267 2818 400 1210 2762 403 1425 2553 437 815 2795
// 541 1081 2391 629 1308 2738 497 1416 2463 817 1124 2775

Bảng 4.8: Vùng tần số formant của nguyên âm trong kết hợp với /m, n, / CTV nam

Nguyên Vùng tần số trung bình formant nguyên âm (Hz)


âm Ngữ cảnh VC Ngữ cảnh V
/m/ /n/ //
F1 F2 F3 F1 F2 F3 F1 F2 F3 F1 F2 F3
/i/ 306 1639 2868 343 1936 2850 381 1874 2964 413 2902 3500
/e/ 347 1537 2552 444 2022 2686 463 1715 2552 557 2169 2818
// 537 2033 2822 505 1854 2831 562 1852 2765 704 2559 3466
// 386 1540 2599 378 1827 2549 458 1318 2904 429 1328 3394

47
// 485 1452 2858 489 1561 2700 697 1382 2859 651 1411 3366
/a/ 834 1771 2893 626 1673 2528 1038 1638 2580 865 1915 3281
/u/ 398 1373 2843 400 1313 2531 606 1040 2854 399 1700 3222
/o/ 444 1318 2800 470 1365 2544 826 1279 2571 503 878 2973
// 626 1364 2823 677 1515 2672 984 1316 2173 664 1290 2810

Bảng 4.9: Vùng tần số formant của nguyên âm trong kết hợp với /m, n, / CTV nữ

i e    a u o 

Biểu đồ 4.5. Vùng phân bố tần số formant của nguyên âm trong kết hợp /m, n, / CTV nam

48
i e    a u o 

Biểu đồ 4.6: Vùng phân bố tần số formant của nguyên âm trong kết hợp /m,
n,/ CTV nữ

4.2.3. Diễn tiến vùng chuyển tiếp formant của nguyên âm


Tất cả các phụ âm cuối /m, n, / trong kết hợp với nguyên âm đều có
ảnh hưởng tới diễn tiến formant của nguyên âm. Tuy nhiên sự ảnh hưởng của
từng phụ âm tới formant là khác nhau. Đặc trưng của vùng ảnh hưởng
formant nguyên âm đứng trước phụ âm /m/ là sự suy giảm tần số của cả F1 và
F2. Cụ thể lần lượt là /i/ bắt đầu ở vùng tần số 368Hz suy giảm và kết thúc ở
tần số rất thấp 196Hz, F2 2156-1656Hz; /e/ F1 344-211Hz, F2 1777-
1573Hz; // F1 652-219Hz, F2 1882-1503Hz; // F1 395-250Hz, F2 1822-
1470Hz; // F1 441-257; F2 1796- 1242; /a/ F1487-247Hz, F2 1911-1242Hz.
Các nguyên âm dòng sau /u/; /o/; // cũng có diễn tiến tương tự. Có thể khái
quát mô hình chuyển tiếp formant trong kết hợp với phụ âm cuối /m/ minh
họa dưới đây:

49
im êm em ưm ơm am um ôm om

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /m/
Nếu như sự ảnh hưởng formant nguyên âm đứng trước phụ âm /m/ là sự
suy giảm về tần số của cả F1 và F2 thì diễn tiến formant của nguyên âm đứng
trước phụ âm /n/ bị ảnh hưởng theo hai chiều khác nhau, sự suy giảm ổn định
của tần số F1, và sự gia tăng của tần số F2 là diễn tiến cơ bản chi phối toàn bộ
làm nên đặc trưng diễn tiến formant của nguyên âm trong kết hợp với phụ
âm /n/ cuối. Điều này đúng cho cả CTV nam và CTV nữ. Xu hướng và diễn
tiến này diễn ra ở tất cả các nguyên âm.
Cụ thể: vùng duy trì ổn định tần số F1 của /i/ bắt đầu ở vùng tần số
366Hz có diễn tiến bằng phẳng đều đặn đến hết phần nguyên âm qua đoạn
chuyển tiếp tần số có xu hướng giảm đều và kết thúc ở tần số thấp hơn; tần số
F2 bắt đầu từ tần số 2174Hz có diễn tiến đều đặn ở đoạn đầu và càng gần
đoạn chuyển tiếp sự gia tăng tần số diễn ra mạnh mẽ đến và kết thúc ở vùng
tần số cao nhất là 2578Hz. Đối với nguyên âm /e/, F1 duy trì ở tần số trên 400
Hz đến gần đoạn chuyển tiếp tần số suy giảm từ từ xuống dưới 300Hz. F2 có
chiều hướng ngược lại, vùng tần số ổn định đến gần đoạn chuyển tiếp sau đó
có xu hướng gia tăng đến tần số 2737Hz, một phần cấu trúc F2 của /e/ bị phá
vỡ thành các điểm rời rạc ở đoạn cuối. Diễn tiến đường nét cũng xảy ra tương
tự đối với các nguyên âm /, , , a, u, o, /. Có thể khái quát mô hình chuyển
tiếp formant của 9 nguyên âm đơn tiếng Việt trong kết hợp với âm /n/ cuối
theo mô hình diễn tiến sau:

50
in ên en ưn ơn an un ôn on

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /n/
Tương tự như sự ảnh hưởng formant nguyên âm đứng trước phụ âm /n/
diễn tiến formant của nguyên âm đứng trước phụ âm // bị ảnh hưởng theo hai
chiều khác nhau, sự suy giảm ổn định của tần số F1, và sự gia tăng của tần số
F2 là diễn tiến cơ bản chi phối toàn bộ làm nên đặc trưng diễn tiến formant
của nguyên âm trong kết hợp với phụ âm // cuối. Điều này đúng cho cả CTV
nam và CTV nữ. Xu hướng và diễn tiến này diễn ra ở tất cả các nguyên âm.
Có thể khái quát mô hình chuyển tiếp formant của 9 nguyên âm đơn
tiếng Việt trong kết hợp với âm /n/ cuối theo mô hình diễn tiến sau:

inh ênh eng ưng ơng ang ung ông ong

Mô hình diễn tiến vùng chuyển tiếp formant F1, F2 của nguyên âm trong kết
hợp phụ âm /ŋ/
4.3. Tiểu kết
Từ những kết quả khảo sát trên, chúng tôi đưa ra một số nhận xét cho
cấu trúc formant của nguyên âm trong kết hợp với hai nhóm phụ âm cuối tắc
trong so sánh với formant của nguyên âm kết hợp với thanh điệu và nhóm phụ
âm đầu tắc như sau:

51
Nếu như trường độ formant của nguyên âm trong kết hợp CV phụ
thuộc vào kết hợp thanh điệu và có sự cách biệt tương đối lớn giữa các kết
hợp thanh khác nhau thì ngược lại sự kết thúc của phụ âm cuối /p, t, k, m, n,
ŋ/ khiến trường độ formant của nguyên âm trong kết hợp VC rất ngắn và
không có sự cách biệt quá lớn giữa các kết hợp thanh điệu. So sánh kết quả
thu được khi đo trường độ nguyên âm trong kết hợp âm cuối /p, t, k/ với
trường độ nguyên âm trong ngữ cảnh độc lập có thể dễ dàng nhận thấy trường
độ các nguyên âm đều bị biến đổi. Sự biến đổi này khiến trường độ nguyên
âm có diễn tiến ngắn hơn rất nhiều, thường thì trường độ chỉ bằng khoảng 1/3
đến 1/2 so với trường độ nguyên âm trong ngữ cảnh độc lập - khi không có
kết hợp với phụ âm đằng trước và sau. Và trường độ nguyên âm cũng thường
được tăng lên một cách đáng kể khi nguyên âm đó có một phụ âm hữu thanh
đi sau, và trường độ của nguyên âm trở thành một đầu mối thẩm nhận quan
trọng đối với đối lập hữu thanh.
Âm tắc cuối /p, t, k, m, n, ŋ/ có ảnh hưởng mạnh mẽ tới cấu trúc
formant của nguyên âm trong cấu trúc VC. Diễn tiến vùng chuyển tiếp giữa
nguyên âm và phụ âm rất mờ nhạt đối với nhóm phụ âm /p, t, k/, khó xác định
ranh giới khiến khu vực phụ âm gần như bị hòa kết liền với nguyên âm. Cấu
trúc và diễn tiến formant của nguyên âm trong đoạn chuyển tiếp bị thay đổi,
tại điểm kết thúc nguyên âm các sóng đi lên hoặc đi xuống với chu kỳ đều
đặn với biên độ giảm dần, và kết thúc đột ngột.
Khi đóng vai trò kết thúc âm tiết các âm tắc đứng sau nguyên âm chúng
đã làm biến đổi âm sắc của nguyên âm ở giai đoạn cuối. Sự chuyển dịch
formant theo các hướng khác nhau phụ thuộc vào kết hợp với các nhóm phụ
âm ở những vị trí và phương thức khác nhau, đây cũng là dấu hiệu quan trọng
duy nhất có thể nhận diện ra các âm cuối. Mô hình tổng quát cho việc nhận

52
dạng các phụ âm cuối với vị trí cấu âm và phương thức cấu âm khác nhau
được khái quát như sau:

am an a

ap at ak

53
KẾT LUẬN

Luận án đã tiến hành khảo sát cấu trúc formant của 9 nguyên âm đơn
tiếng Việt trong kết hợp với thanh điệu và phụ âm tắc ở những vị trí đầu và
kết thúc âm tiết bằng phương pháp thực nghiệm và đã khái quát các đặc trưng
về trường độ, vùng tần số và diễn tiến tần số formant trong các kết hợp.
Từ những khảo sát về cấu trúc formant của nguyên âm trong các kết hợp
cho phép chúng tôi rút ra một số kết luận sau:
1. Các khía cạnh chiết đoạn và siêu đoạn của tín hiệu lời nói không
hành chức một cách độc lập với nhau. Cụ thể là, có nhiều sự tương tác lẫn
nhau quan trọng giữa cấu trúc chiết đoạn ở đây là nguyên âm và mô hình cao
độ của thanh điệu đi kèm.
- Cao độ thanh điệu ảnh hưởng lớn đến trường độ của nguyên âm, các
kết hợp nguyên âm với thanh ngang, ngã có trường độ dài hơn các kết hợp với
thanh sắc, hỏi, nặng.
- Thanh điệu cũng tác động đến vùng tần số của các nguyên âm đơn
tiếng Việt. Nhìn chung, những ảnh hưởng của thanh điệu làm cho tần số F1,
F2 của nguyên âm tăng lên đáng kể. Sự ảnh hưởng này xảy ra ở các kết hợp
thanh cao, nhất là đối với các kết hợp thanh ngang, ngã, sắc.
- Thanh điệu có ảnh hưởng tới diễn tiến formant của các nguyên âm
ngay ở phần đầu, sự ảnh hưởng này kéo vùng tần số formant của nguyên âm
cao hơn hoặc thấp hơn tần số thông thường của nó tạo nên một đoạn đi lên
hoặc đi xuống giữa thanh điệu và nguyên âm mà nó kết hợp. Điều này biến
đổi cấu trúc đường nét formant làm cho nó có thể đi lên hay đi xuống ở phần
đầu so với cấu trúc ban đầu. Một số thanh điệu khiến cho tần số F2 của
nguyên âm không ổn định mà bị phá vỡ thành các điểm rời rạc.

54
2. Tất cả những diễn tiến tần số của F1 và F2 ở 9 nguyên âm đơn theo
hướng từ tần số thấp đi dần đến tần số cao hay ngược lại đều phụ thuộc vào
hai yếu tố của phụ âm đầu: thanh tính và trường độ của phụ âm mà trong đó
yếu tố thanh tính có vai trò quyết định nhất.
- Đối với các âm tắc đầu vô thanh nghiên cứu đã chỉ ra rằng 10 hoặc 20
ms đầu tiên của đoạn giải phóng điểm tắc thường là dấu hiệu cần thiết cho
việc nhận dạng một cách chính xác các phụ âm. Đối với các phụ âm mũi thì
đoạn này dài hơn thường từ 30 đến 50 ms. Những kết quả này đã chỉ ra rằng
việc nhận dạng các phụ âm hoàn toàn phụ thuộc vào vùng chuyển tiếp
formant từ hạt nhân âm học của âm tiết, trong một số trường hợp nó thực sự
làm tăng thêm độ tin cậy trong việc nhận dạng.
- Trường độ của một nguyên âm trong kết hợp với âm tắc đầu trong
một lần đo đạc nào đó sẽ phụ thuộc vào bối cảnh và chất lượng của nó, và
không có một trường độ tối thiểu của một nguyên âm dài hay trường độ tối đa
của một nguyên âm ngắn. Nếu hai nguyên âm đối lập với nhau về trường độ,
thì cái có vấn đề nhất là trường độ của chúng có liên quan với nhau trong các
bối cảnh tương đương. Phụ âm tắc /p, t, k/ có trường độ rất ngắn và nó ảnh
hưởng mạnh mẽ đến trường độ formant của nguyên âm. Ngược lại nhóm phụ
âm mũi hữu thanh /m, n, / có trường độ dài hơn và nó cũng làm rút ngắn
trường độ của nguyên âm đứng sau làm cho trường độ của nguyên âm ngắn
hơn so với ngữ cảnh độc lập từ 10 đến 50ms.
- Về diễn tiến vùng tần số, bản thân /p, t, k, m, n, / là những phụ âm
tắc với những phương thức và vị trí cấu âm khác nhau chúng có ảnh hưởng
nhiều đến vùng tần số formant của các nguyên âm trong kết hợp theo những
xu hướng khác nhau. Cụ thể đối với các phụ âm môi /p, m/ khi đứng trước
nguyên âm hai phụ âm này có xu hướng làm suy giảm vùng tần số F1 và F2
của nguyên âm, sự suy giảm ở /p/ diễn ra mạnh mẽ hơn /m/.

55
- Về diễn tiến đường nét formant, sự ảnh hưởng giữa C đến V và V đến
C rất khác nhau. Các chuyển tiếp CV thường dễ dàng nhận diện và có ranh
giới rõ rệt, ngược lại các chuyển tiếp VC thường thể hiện mờ nhạt, hòa kết với
V. Chính vì vậy, để nhận diện C trong cấu trúc âm tiết thường gặp khó khăn
và cần phải dựa vào thông tin của V.
3. Đối với cấu trúc formant của nguyên âm trong kết hợp với hai nhóm
phụ âm cuối tắc trong so sánh với formant của nguyên âm kết hợp với thanh
điệu và nhóm phụ âm đầu tắc như sau:
Nếu như trường độ formant của nguyên âm trong kết hợp CV phụ
thuộc vào kết hợp thanh điệu và có sự cách biệt tương đối lớn giữa các kết
hợp thanh khác nhau thì ngược lại sự kết thúc của phụ âm cuối /p, t, k, m, n,
ŋ/ khiến trường độ formant của nguyên âm trong kết hợp VC rất ngắn và
không có sự cách biệt quá lớn giữa các kết hợp thanh điệu. So sánh kết quả
thu được khi đo trường độ nguyên âm trong kết hợp âm cuối /p, t, k/ với
trường độ nguyên âm trong ngữ cảnh độc lập có thể dễ dàng nhận thấy trường
độ các nguyên âm đều bị biến đổi. Sự biến đổi này khiến trường độ nguyên
âm có diễn tiến ngắn hơn rất nhiều, thường thì trường độ chỉ bằng khoảng 1/3
đến 1/2 so với trường độ nguyên âm trong ngữ cảnh độc lập - khi không có
kết hợp với phụ âm đằng trước và sau.
Khi đóng vai trò kết thúc âm tiết các âm tắc đứng sau nguyên âm chúng
đã làm biến đổi âm sắc của nguyên âm ở giai đoạn cuối. Sự chuyển dịch
formant theo các hướng khác nhau phụ thuộc vào kết hợp với các nhóm phụ
âm ở những vị trí và phương thức khác nhau, đây cũng là dấu hiệu quan trọng
duy nhất có thể nhận diện ra các âm cuối.
Âm tắc cuối /p, t, k, m, n, ŋ/ có ảnh hưởng mạnh mẽ tới cấu trúc formant của
nguyên âm trong cấu trúc VC. Diễn tiến vùng chuyển tiếp giữa nguyên âm và
phụ âm rất mờ nhạt đối với nhóm phụ âm /p, t, k/, khó xác định ranh giới

56
khiến khu vực phụ âm gần như bị hòa kết liền với nguyên âm. Cấu trúc và
diễn tiến formant của nguyên âm trong đoạn chuyển tiếp bị thay đổi, tại điểm
kết thúc nguyên âm các sóng đi lên hoặc đi xuống với chu kỳ đều đặn với
biên độ giảm dần, và kết thúc đột ngột.

57
DANH MỤC TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt


1. Nguyễn Văn Ái (1973), Tìm hiểu về vùng tần số foóc - man của các
nguyên âm tiếng Việt bằng phương pháp thực nghiệm, T/c Ngôn ngữ, số
4.
2. Nguyễn Văn Ái (1974), Bàn về số lượng và sự phân bố foóc - man của
các nguyên âm đơn tiếng Việt qua bản ghi Xô - na - gơ - rap, T/c Ngôn
ngữ, số 1.
3. Eƒimov Aju (1991), Về nguồn gốc các thanh điệu tiếng Việt, Ngôn ngữ,
Số 1, tr. 78 - 85.
4. Vũ Kim Bảng (1999), Khái niệm ngữ âm học, T/c Ngôn ngữ, số 5.
5. Vũ Kim Bảng (1986). Nhận xét về trường độ thanh điệu qua phương
ngữ Hà Nội và phương ngữ Nam Bộ (cứ liệu thực nghiệm) - Những vấn đề
ngôn ngữ học về các ngôn ngữ phương Đông - Viện Thông tin Khoa học
Xã hội, tr 370-376.
6. Vũ Kim Bảng (2002), Hệ formant của nguyên âm tiếng Hà Nội, T/c
Ngôn ngữ, số 15.
7. Nguyễn Phan Cảnh (1978), Bản chất cấu trúc âm tiết tính của ngôn
ngữ: dẫn liệu về một sự miêu tả không phân lập đối với âm vị học Việt
Nam, Ngôn ngữ , số 2, tr. 5 - 18.
8. Nguyễn Phan Cảnh (1965), Vài ý kiến về vấn đề giải thuyết âm vị học
các âm cuối trong tiếng Việt hiện đại, Thông báo khoa học, t.2. Đại học
tổng hợp Hà Nội, tr 114-123.
9. Nguyễn Phan Cảnh (1978), Âm vị học các ngôn ngữ thanh điệu, Ngôn
ngữ, Số 1 - 2, tr. 13- 24.

58
10. Nguyễn Tài Cẩn (1995), Giáo trình lịch sử ngữ âm tiếng Việt (sơ thảo),
Nxb Giáo dục, H, 384 tr.
11. Nguyễn Tài Cẩn (1971), Cứ liệu ngữ âm lịch sử với vấn đề thời kỳ xuất
hiện chữ Nôm, Ngôn ngữ, Số 1, tr. 26 - 43.
12. Nguyễn Tài Cẩn (1977), Về một vài hiện tượng đặc biệt trong quá trình
diễn biến từ các âm môi tiếng Hán trung cổ sang cách gọi Hán Việt hiện
nay, Ngôn ngữ, Số 4, tr. 12 - 22.
13. Hoàng Cao Cương (1986), Suy nghĩ thêm về thanh điệu tiếng Việt, T/c
Ngôn ngữ, số 3.
14. Hoàng Cao Cương (1984), Về khái niệm ngôn điệu. T/c Ngôn ngữ, Số 2.
15. Hoàng Cao Cương (1984), Nhận xét về một đặc điểm ngữ âm các từ láy
đôi tiếng Việt. T/c Ngôn ngữ, Số 4.
16. Hoàng Cao Cương (1985), Bước đầu nhận xét về đặc điểm ngữ điệu
tiếng Việt (trên cứ liệu thực nghiệm). T/c Ngôn ngữ, Số 3.
17. Hoàng Cao Cương (1985), Thanh điệu trong từ láy đôi tiếng Việt. T/c
Ngôn ngữ, Số 4.
18. Hoàng Cao Cương (1989), Thanh điệu Việt qua giọng địa phương trên
cứ liệu Fo. T/c Ngôn ngữ, Số 4. tr. 1-17.
19. Hoàng Cao Cương (2002), Về biểu diễn âm vị học cho trường hợp tiếng
Việt. T/c Ngôn ngữ, Số 6.
20. Hoàng Cao Cương (2003), Nhập môn vào ngữ điệu tiếng Việt. Trong
“Cơ sở lí luận của ngữ pháp tiếng Việt”. Nhiệm vụ cấp Bộ. PGS.TSKH.
Lý Toàn Thắng chủ nhiệm. Viện Ngôn ngữ học., Hà Nội.
21. Hoàng Cao Cương (1986), Điệu tính và phi điệu tính trong thanh điệu
tiếng Việt. Trong - Những vấn đề ngôn ngữ học về các ngôn ngữ phương
Đông - Viện Thông tin Khoa học Xã hội, tr. 64-70.

59
22. Hoàng Thị Châu. (1989). Tiếng Việt trên các miền đất nước: Phương
ngữ học. Hà Nội: Khoa học xã hội.
23. Hoàng Thị Châu (1972), Vài nhận xét về sự thay đổi ngữ âm của tiếng
Việt trong nông thôn hiện nay (qua kết quả điều tra thổ ngữ ở Vĩnh Linh
và Thái Bình), Ngôn ngữ, Số 4, tr. 9 - 18.
24. Hoàng Thị Châu (1988), Về bốn phụ âm ngạc hoá còn lại trong tiếng
Việt vùng bắc Bình Trị Thiên, Tiếng Việt và các ngôn ngữ Đông Nam á,
NXB KHXH, Hà Nội, tr. 19 - 22.
25. Mai Ngọc Chừ (1988), Thanh điệu trong vần thơ Việt Nam hiện đại,
“Tạp chí khoa học” (Khoa học xã hội), Trường Đại học Tổng hợp Hà Nội,
số 4.
26. Mai Ngọc Chừ (1989), Vần, nhịp, thanh điệu và sức mạnh biểu đạt ý
nghĩa của lục bát biến thể, Văn hoá dân gian, số 2.
27. Mai Ngọc Chừ (1989), Thanh điệu tiếng Việt và sự “tròn vành rõ chữ”
của tiếng hát dân tộc, Thông tin khoa học của trường Đại học tổng hợp
Hà Nội, Chuyên san Ngôn ngữ học, số 5.
28. Mai Ngọc Chừ, Vũ Đức Nghiệu, Hoàng Trọng Phiến (1990), Cơ sở
ngôn ngữ học và tiếng Việt, NXB ĐH & THCN, Hà Nội.
29. Trần Trí Dõi (1988), Tìm hiểu thêm về nguồn gốc thanh điệu tiếng Việt
ở những từ có âm cuối vang, “Tiếng Việt và các ngôn ngữ Đông Nam Á”,
Nxb Khoa học xã hội Hà Nội, tr 40 – 45.
30. Trần Trí Dõi (2006), Thử giải thích hiện tượng có năm thanh điệu trong
một vài phương ngữ Việt, Ngôn ngữ, Số 8, tr 13-21.
31. Trần Trí Dõi (2009), Về nguồn gốc lịch sử của dãy âm đầu mũi /m,n, ɲ,
ŋ/ hiện nay trong tiếng Việt, T/c Ngôn ngữ, số 11, tr 1-11.
32. Trần Trí Dõi (2010), Tương ứng thanh điệu các từ Hán Việt cổ – Hán
Việt góp phần giải thích nguồn gốc thanh điệu tiếng Việt, Hội thảo “Ngôn

60
ngữ học toàn quốc 2010: Ngôn ngữ học và các ngôn ngữ ở Việt Nam”,
Nxb Đại học Quốc gia Hà Nội, Hà Nội, tr 51.59.
33. Trần Trí Dõi (1991), Về các âm đầu tiền thanh hầu hóa trong proto Việt
Mường, T/c Ngôn ngữ, số 2. tr 28-34.
34. Trần Trí Dõi (1982), Sự biến hóa của các âm tắc giữa trong tiếng Việt,
T/c Ngôn ngữ, Số 2, tr 1-22.
35. Hoàng Dũng (1998), Mấy vấn đề về âm tắc bên (Lateralstops) Việt
trong bối cảnh các ngôn ngữ khu vực, Ngôn ngữ, Số 2, tr. 3 -13.
36. Nguyễn Hàm Dương (1964), Âm tiết trong tiếng Việt, một đơn vị tín
hiệu cơ bản, Thông báo khoa học, Đại học tổng hợp Hà Nội. T/c Ngôn
ngữ, số 2.
37. Nguyễn Hàm Dương (1987), Âm vị học phân đoạn và âm vị học không
phân đoạn. T/c Ngôn ngữ, số 1-2, (tr. 24-30).
38. Phạm Văn Hảo (2003), Tổ hợp phụ âm tl trong thổ ngữ Đức An, Đức
Thọ, Hà Tĩnh, Ngôn ngữ & đời sống. Số 1+2.
39. Phạm Văn Hảo (1998), Để góp phần lý giải thanh hỏi trong lối nói ph-
ương ngữ 'ổng', 'chỉ', 'ngoải', Ngôn ngữ. Số 4.
40. Cao Xuân Hạo (1998), Chiết đoạn và siêu đoạn trong ngôn ngữ học
phương Tây và trong tiếng Việt, trong Tiếng Việt – Mấy vấn đề ngữ âm,
ngữ pháp và ngữ nghĩa. H, Nxb Giáo dục (tr 62-79).
41. Cao Xuân Hạo (1998), Nguyên lí "tuyến tính của năng biểu" trong âm
vị học, trong Tiếng Việt – Mấy vấn đề ngữ âm, ngữ pháp và ngữ nghĩa. H,
Nxb Giáo dục (tr 46-61).
42. Cao Xuân Hạo (1998), Nhận xét về các nguyên âm của một phương ngữ
ở tỉnh Quảng Nam, trong Tiếng Việt – Mấy vấn đề ngữ âm, ngữ pháp và
ngữ nghĩa. H, Nxb Giáo dục (tr 128-136).
43. Cao Xuân Hạo (2001), Tiếng Việt - Văn Việt - Người Việt. Nxb Trẻ.

61
44. Cao Xuân Hạo (2006), Tiếng Việt sơ thảo ngữ pháp chức năng. Nxb
KHXH.
45. Cao Xuân Hạo (1998), Trọng âm và các quan hệ ngữ pháp trong tiếng
Việt, trong Tiếng Việt - Mấy vấn đề ngữ âm, ngữ pháp và ngữ nghĩa. H,
Nxb Giáo dục.
46. A.G. Haudricourt (1991), Về nguồn gốc các thanh của tiếng Việt, Ngôn
ngữ Số 1, tr. 23- 31.
47. Nguyễn Quang Hồng (1976), Âm tiết tiếng Việt, chức năng và cấu trúc
của nó, T/c Ngôn ngữ, số 3.
48. Nguyễn Quang Hồng (1982), Tương phản âm thanh và khả năng phân
lập đoạn tính trong lòng các âm tiết tiếng Việt so với tiếng Hán, Ngôn
ngữ, Số 1, tr. 43 - 47.
49. Vũ Bá Hùng (1980), Về vai trò hệ thống ngữ âm các phương ngôn của
tiếng Việt trong giao tiếp xã hội, Ngôn ngữ, Số 4, tr. 1 - 8.
50. Vũ Bá Hùng (1981), Vài suy nghĩ về một số biến thể ngữ âm có liên
quan đến việc xác lập chuẩn mực từ vựng của tiếng Việt, Giữ gìn sự trong
sáng của tiếng Việt về mặt từ ngữ, NXB KHXH, tr. 364 - 372.
51. Vũ Bá Hùng (1990), Đặc trưng của thanh điệu tiếng Việt trong ngữ
cảnh vi mô: (trên cơ sở của cứ liệu thực nghiệm), tiếng Việt và một số
ngôn ngữ dân tộc trên bình diện ngữ âm, H, tr 327-350.
52. Vũ Bá Hùng (1991), Nguồn gốc các thanh điệu tiếng Việt và cách nhìn
đồng đại của sự khảo sát thực nghiệm, Ngôn ngữ, số 1.
53. Vũ Bá Hùng (2000), Về đặc trưng cơ bản của thanh điệu tiếng Việt ở
trạng thái tĩnh: Trên cơ sở cứ liệu phân tích thực nghiệm, tiếng Việt và
một số ngôn ngữ dân tộc trên bình diện ngữ âm, H, tr 382-327.
54. Vũ Bá Hùng (1976), Vấn đề âm tiết của tiếng Việt, T/c Ngôn ngữ số 3,
1976.

62
55. Võ Bình (1982), Vài ý kiến bàn thêm về âm tiết tiếng Việt, trong Ngôn
Ngữ số 52(2.1982), pp. 38-48.
56. Nguyễn Văn Lợi (1987), Loại hình học đồng đại và lịch đại hiện tượng
tiền mũi trong các ngôn ngữ Đông Nam Á. T/c Ngôn ngữ, số 1-2, (tr.36-
47).
57. Nguyễn Văn Lợi (1991), Về quá trình hình thành sự đối lập âm vực
thanh điệu trong các ngôn ngữ Việt Mường, Ngôn ngữ, Số 1, tr. 49 - 59
58. Nguyễn Văn Lợi (2002), Thanh điệu của một vài thổ ngữ Nghệ An từ
góc nhìn đồng đại và lịch đại (dựa trên kết quả phân tích ngữ âm thực
nghiệm bằng Computer), T/c Ngôn ngữ, số 3. tr1-12.
59. Nguyễn Văn Lợi, Jerold A. Edmondson (1997), Thanh điệu và chất
giọng (voice quality) trong tiếng Việt hiện đại (phương ngữ Bắc bộ):
Khảo sát thực nghiệm, T/c Ngôn ngữ, số 1. tr1-16.
60. Ferlus Michel (1981), Sự biến hoá các âm tắc giữa (obstuents mediales)
trong tiếng Việt, Ngôn ngữ, Số 2, tr. 1- 22.
61. Lê Hồng Minh (2009), Nghiên cứu giải pháp nâng cao chất lượng tiếng
Việt tổng hợp trong các hệ chuyển từ văn bản thành tiếng nói, luận án tiến
sĩ kĩ thuật, Đại học Bách khoa Hà Nội.
62. Nguyễn Ngọc San (1985), Thử tìm hiểu một vài sự chuyển biến âm đầu
trong tiếng Việt cổ qua cứ liệu Nôm, Ngôn ngữ, Số 3, tr. 28 - 39.
63. Nguyễn Văn Tài (1984), Tư liệu về sự biến đổi các nguyên âm Việt -
Mường chung, Ngôn ngữ, Số 4, tr. 52 - 60.
64. Trần Thị Thìn (1981), Vài nét về những từ có quan hệ ngữ âm nh - d, nh
- r, Giữ gìn sự trong sáng của tiếng Việt về mặt từ ngữ, Hà Nội, tr. 345 -
351.
65. Phan Thiều (1983), Hình vị và âm tiết, T/c Ngôn ngữ, số 1.

63
66. Đinh Lê Thư (1984), Những biến thể về phương thức cấu tạo phụ âm
đầu trong các tiếng địa phương miền Bắc Việt Nam, Ngôn ngữ, Số 1, tr.9 -
15.
67. Đinh Lê Thư (1985), Sự hiện thực hoá về mặt ngữ âm của thế đối lập
hữu thanh - vô thanh của phụ âm đầu trong tiếng Việt, Ngôn ngữ số 2,
tr.67-71.
68. Đinh Lê Thư (1982), Bàn về âm tắc thanh hầu mở đầu âm tiết tiếng
Việt. T/c Ngôn ngữ, số 3, tr. 47-51
69. Đinh Lê Thư (1983), Đặc tính thời gian của phụ âm đầu trong tiếng
Việt. TBKH, trường ĐH Tổng hợp,TP.HCM; Phần A: Khoa học xã hội, số
1, tr.55-62.
70. Đinh Lê Thư, Nguyễn Văn Huệ, Ngữ âm tiếng Việt, Nxb Giáo dục,
1998.
71. Đoàn Thiện Thuật (1980), Ngữ âm tiếng Việt, Hà Nội: Đại học và Trung
học Chuyên nghiệp.
72. Hoàng Tuệ (1962), Hệ thống ngữ âm và ngữ pháp tiếng Việt trong
Hoàng Tuệ et. al.(1962), Giáo Trình về Việt Ngữ (sơ thảo), tập I. Hà Nội:
Nxb. Giáo Dục.
73. Lê Văn Lý (1968), Sơ Thảo Ngữ Pháp Việt Nam. Saigon: Trung Tâm
Học Liệu.
74. Nguyễn Bạt Tuỵ (1949), Chữ và Vần Việt Khoa Học. Sài Gòn: Ngôn
Ngữ.
75. Nguyễn, Bạt Tuỵ (1959), Ngôn Ngữ Học Việt Nam. Sài Gòn: Ngôn Ngữ
76. Viện Ngôn ngữ học (Phòng Ngữ âm học) (2000), Nghiên cứu các đặc
trưng ngữ âm của tiếng Hà nội - Nguyên âm, Đề tài khoa học cấp Viện.
77. Viện Ngôn ngữ học (Phòng Ngữ âm học) (2002), Nghiên cứu các đặc
trưng ngữ âm của tiếng Hà nội – Phụ âm, Đề tài khoa học cấp Viện.

64
78. Viện Ngôn ngữ học (Phòng Ngữ âm học) (2004), Nghiên cứu các đặc
trưng ngữ âm của tiếng Hà nội – Các thổ ngữ ngoại thành Hà Nội, Đề tài
khoa học cấp Viện.
Tài liệu tiếng Anh
79. Baldon R.A.W., & Fant G (1978), A two – formant model and the
cardinal vowels, STL – QPRS1, 1- 8.
80. Bernard JRL & RH Mannell (1986), A study of /h-d/ words in
Australian English Speech, Hearing and Language Centre, Working Paper
Macquarie Uneversity: 1-106.
81. Butcher, A (2006), Formant frequencies of /hVd/ vowels in the speech
of South Australian females, Proceeding of the 11th Australian
International Coference on Speech Science & Technology, University of
Auckland, New Zealand, Dec.
82. Brunelle, Marc (2003), Coarticulation effects in northern Vietnamese
tones, Proceedings of the 15th International Conference of Phonetic
Sciences, http://aix1.uottawa.ca/~mbrunell/Viet%20coarticulation.pdf
83. Brunelle, Marc (2009), Tone perception in Northern and Southern
Vietnamese, Journal of Phonetics 37 (1): 79–96.
84. CadiÌre, L.(1911), Monographie de la semi-voyelle labiale en sino-
annamite, B.E.F.E.O,1911, t. XI.
85. Catfort, J. C.(1988), A Practical Introduction to Phonetics, Clarendon
Press, Oxford.
86. Cosgrove, P.; Wilson, J.P.; Patterson, R.D (1989), Formant transition
detection in isolated vowels with transitions ininitial and final position,
Acoustics, Speech, and Signal Processing, Volume , Issue , 23-26 May
1989 Page(s):278 - 281 vol.1

65
87. Delattre,P.C; Liberman, A.M; Cooper, F.S (1955), Acoustic Lloci and
Transitional Cues for Consonants, J.A.S.A 27, tr769-773.
http://www.haskins.yale.edu/Reprints/HL0048.pdf
88. Delattre,P.C; Liberman, A.M; Cooper, F.S (1958), Formant transitions
and loci as acoustic correlates of place of articulation in American
fricatives, http://www.haskins.yale.edu/Reprints/HL0048.pdf
89. Deterding, David (1997). The Formants of Monophthong Vowels in
Standard Southern British English Pronunciation, Journal of the
International Phonetic Association, 27, pp. 47-55.
90. Earle, M. A. (1975). An acoustic study of northern Vietnamese tones.
Santa Barbara: Speech Communications Research Laboratory, Inc.
91. Emeneau, M.B. (1951), Studies in Vietnamese (Annamese) Grammar.
Berkeley & Los Angeles: University of California Press.
92. Fant, G. (1969). Stops in CV-syllables, STL-QPSR 4/1969, pp. 1-25.
93. Fant, G. (1960). Acoustic Theory of Speech Production. Mouton & Co,
The Hague, Netherlands.
94. Fant, G. (2000). Half a century in phonetics and speech research. /pdf/
95. Jackson, P.J.B. (2001). Acoustic cues of voiced and voiceless plosives
for determining place of articulation. in: Proc. CRAC Workshop. Aalborg,
Denmark. pp. 19–22.
96. J. Hant and A. Alwan (1999), Modeling the masking of formant
transitions in noise, Proc. of Eurospeech 99, Budapest, Hungary, Vol. 4, p.
1895-1898.
97. Jingzhu, Y, A, (1995). Study of the formant transitions between the first
syllable with vocalic ending and the second syllable with initial vowel in
the disyllabic sequence in Standard Chinese. In
http//www.ling.cass.cn/yuyin/report/file/1994-1995-p4

66
98. Han, Mieko (1966), Vietnamese vowels, Studies in the phonology of
Asian languages, 4, Los Angeles: Acoustic Phonetics Research
Laboratory: University of Southern California
99. Han, Mieko S. (1968). Complex syllable nuclei in Vietnamese. Studies
in the phonology of Asian languages (Vol. 6); U.S. Office of Naval
Research. Los Angeles: University of Southern California.
100. Han, Mieko S. (1969). Vietnamese tones. Studies in the phonology of
Asian languages (Vol. 8). Los Angeles: Acoustic Phonetics Research
Laboratory, University of Southern California.
101. Han, Mieko S.; & Kim, Kong-On. (1972). Intertonal influences in two-
syllable utterances of Vietnamese. Studies in the phonology of Asian
languages (Vol. 10). Los Angeles: Acoustic Phonetics Research
Laboratory, University of Southern California.
102. Han, Mieko S.; & Kim, Kong-On. (1974). Phonetic variation of
Vietnamese tones in disyllabic utterances. Journal of Phonetics, 2, 223-
232.
103. Harris, K.S; Hoffman, H.S; Liberman, A.M; Delattre, P.C; Cooper, F.S,
(1958). Effect of Third-Formant Transitions on Perception of Voiced Stop
Consonants, The Journal of the Acoustical Society of America, Vol 30, No
2, pp 122-126, Feb.
104. Hayward, Katrina (2000) Experimental Phonetics, Harlow, UK:
Pearson, p. 149. ISBN 0-582-29137-2
105. Hermann L., Abhandlungen in Pflügers Archiv f.d. ges Physiologie, Bd.
45, 1989.
106. Hombert J, M (1978), Consonant types, vovel guality and tone, in V.
Frodin (ed.) Tone : a Linguistic Survey, Academic Press, pp. 17-111.

67
107. Hombert J, M., J. Ohala and Y. Ewan (1979), Phonetic explanations for
the development of tones, 55 (l), pp. 37-58.
108. Ladefoged, Peter (2001) Vowels and Consonants: An Introduction to the
Sounds of Language, Maldern, MA: Blackwell, p. 40. ISBN 0-631-21412-
7
109. Ladefoged P., & Maddieson I.(1990), Vowels of the World's Languages,
Journal of phonetics 18.
110. Lindblom B. (1986), Phonetic Universals in Vowel system,
Experimental Phonology (J.J. Ohala & J.J. Jaeger, eds.), Orlando:
Academic Press.
111. Malécot, A (1957). Acoustic Cues for Nasal Consonants. Lang. 32, 274-
284.
112. Michaud, Alexis (2004), "Final consonants and glottalization: New
perspectives from Hanoi Vietnamese", Phonetica 61 (2–3): 119–146,
doi:10.1159/000082560, PMID 15662108
113. Michaud, Alexis; Vu-Ngoc, Tuan; Amelot, Angélique; Roubeau,
Bernard (2006), "Nasal release, nasal finals and tonal contrasts in Hanoi
Vietnamese: an aerodynamic experiment", Mon-Khmer Studies 36: 121–
137
114. Misra, Deepshikha. (2009). Formant Structures of Hindi and Punjabi
Vowels: A study in Comparing Acoustic Space, Unpublished M. phil.
Dissertation, Centrer for Linguistics JNU.
115. Nguyễn, Đình-Hoà. (1955). Quốc-ngữ: The modern writing system in
Vietnam. Washington, D. C.
116. Nguyễn, Đình-Hoà. (1959). Hòa's Vietnamese-English dictionary.
Saigon. (Revised as Nguyễn 1966 & 1995).

68
117. Nguyễn, Đình-Hoà. (1966). Vietnamese-English dictionary. Rutland,
VT: C.E. Tuttle Co. (Revised version of Nguyễn 1959).
118. Nguyễn, Đình-Hoà. (1992). Vietnamese phonology and graphemic
borrowings from Chinese: The Book of 3,000 Characters revisited. Mon-
Khmer Studies, 20, 163-182.
119. Nguyễn, Đình-Hoà. (1995). NTC's Vietnamese-English dictionary (rev.
ed.). Lincolnwood, IL.: NTC Pub. Group. (Revised & expanded version
of Nguyễn 1966).
120. Nguyễn, Đình-Hoà. (1996). Vietnamese. In P. T. Daniels, & W. Bright
(Eds.), The world's writing systems, (pp. 691–699). New York: Oxford
University Press. ISBN 0-19-507993-0.
121. Nguyễn, Đình-Hoà (1997), Vietnamese: Tiếng Việt không son phấn,
Amsterdam: John Benjamins Publishing Company, ISBN 1-55619-733-0
122. Nguyễn, Đăng-Liêm (1970), Vietnamese pronunciation, PALI language
texts: Southeast Asia., Honolulu: University of Hawaii Press, ISBN 0-
87022-462-X
123. Nguyễn, Văn Lợi; Edmondson, Jerold A (1998), "Tones and voice
quality in modern northern Vietnamese: Instrumental case studies", Mon-
Khmer Studies 28: 1–1
124. Ohala, M; Ohala, J.J, (1998) Correlation between consonantal VC
transitions and degree of perceptual confusion of place contrast in Hindi,
5th International Conference on Spoken Language Processing, Sydney,
Australia, Dec.
125. Ohman, S. E. G. (1966): Coarticulation in VCV utteranccs:
Spectrographic measurements", J. Acoust. Soc. Am. 39, pp. 151- 166.
126. Peterson, G.E., and H.L. Barney (1952), Control Methods Used in a
Study of the Vowels, Journal of the Acoustical Society of America, vol. 24.

69
127. Phạm Hoa. (2001). A phonetic study of Vietnamese tones:
Reconsideration of the register flip-flop rule in reduplication. In C. Féry,
A. D. Green, & R. van de Vijver (Eds.), Proceedings of HILP5 (pp. 140–
158). Linguistics in Potsdam (No. 12). Potsdam: Universität Potsdam (5th
conference of the Holland Institute of Linguistics-Phonology. ISBN 3-
935024-27-4.
128. Phạm Hoa T. (Andrea) (2001), Vietnamese Tone: Tone is not pitch.
Ph.D. dissertation, University of Toronto.
129. Phạm Hoa Andrea. (2003). Vietnamese Tone - A New Analysis. New
York: Routledge. ISBN 0415967627
130. Phạm Hoa Andrea. (2006). Vietnamese Rhyme. Southwest Journal of
Linguistics, Vol 25, 107-142.
131. Pike, K. L. (1943), Phonetics, Ann Arbor: Univetsity of Michigan Press.
132. Pike, K.L.(1947), Phonemics: A Technique for Reducing Languages to
Writing, Univ. of Michigan Publications Linguistics, vol III., Ann Arbor,
Univ. of Michigan Press.
133. Seitz, P. (1986). Relationships between tones and segments in
Vietnamese. Unpublished Ph.D., University of Pensylvania (UMI).
134. Shinji Maeda, Martine Toda, Michael Aron, Marie-Odile Berger, (2008)
Modeling Subject-Specific Formant Transition Patterns in /aSa/ Sequences,
8th International Seminar On Speech Production - ISSP' 08 (2008), 357-360.
135. Smits, R. (2009). Human Consonant Recognition For Initial And Final
Segments of VCV Utterances. @:
http://pitch.phon.ucl.ac.uk/home/shl10/roel/real.htm. Department of
Phonetics and Linguistics, University College London.
136. Stevens, K. N. (1998). Acoustic phonetics. Cambridge: MIT Press.

70
137. Stevens, K. N., Blumstein S. E. (1978). Invariant cues for place of
articulation in stop consonants. in: J. Acoust. Soc. Am., vol. 64, no. 5, pp.
1358–1368.
138. Tomasz Kuczmarski (2009), Formant Trajectories in CV Clusters for
German Stops, INVESTIGATIONES LINGUISTICAE VOL.XVIII.
139. Thompson, Laurence (1959), Saigon phonemics, Language (Language,
Vol. 35, No. 3) 35 (3): 454–476, doi:10.2307/411232, JSTOR 411232
140. Thompson, Laurence (1967), "The history of Vietnamese final palatals",
Language (Language, Vol. 43, No. 1) 43 (1): 362–371,
doi:10.2307/411402, JSTOR 411402
141. Thompson, Laurence (1965), A Vietnamese reference grammar (1 ed.),
Seattle: University of Washington Press., ISBN 0824811178
142. Vũ Thanh Phương (1981), The acoustic and perceptual nature of tone in
Vietnamese. Ph.D. dissertation. Australian National University, Canberra.
143. Vũ Thanh Phương (1982), Phonetic properties of Vietnamese tone
across dialects. In D. Bradley (Ed.), Papers in Southeast Asian
linguistics: Tonation (Vol. 8, pp. 55–75). Sydney: Pacific Linguistics, The
Australian National University.
144. Well, J.C. (1962). A study of the formants of the pure Vowel of British
English. MA dissertation, University College London.
<htttp://www.phon.ucl.ac.uk/home/wells/formants/index.htm>
145. Wright J. T.(1986), The Behaviuor of Nasalized Vowels in the
Perceptual Vowel Space, Experimental Phonology (J. J. Ohana & J. J.
Jaeger, eds), Orlando: Heademic Press.
146. Xu, Yi (1999). Effects of tone and focus on the formation and alignment
of F0 contours. Journal of Phonetics 27, 55-105.
147. Yoshida, A; Oashi, H; Yamaguchi, Y, (2005). Structure formant
transition in voiced stop consonants, Technical report of. Ieice, Sp 2004-
166.

71
148. Zheng, Y., Hasegawa-Johnson, M., Borys, S. (2004). Stop consonant
classification by dynamic formant trajectory. in: Interspeech-2004, pp.
2481-2484.

72
PHỤ LỤC
Trong phần này chúng tôi cung cấp những tư liệu về formant của
nguyên âm bằng cách sử dụng phần mềm Praat. Những tư liệu trong phần này
nhằm xác minh và minh họa cho nội dung các chương 2, 3, 4 của luận án. Thứ
tự được trình bày như sau:
1. Vùng tần số formant của nguyên âm trong các kết hợp với thanh
điệu, âm đầu và âm cuối
2. Trường độ formant của nguyên âm trong kết hợp với thanh điệu, âm
đầu và âm cuối.
3. Ảnh phổ mô tả diễn tiến formant của nguyên âm trong các kết hợp
Ảnh phổ mô tả các formant của nguyên âm là những vệt ngang thẫm
gần song song, gần đoạn tiếp giáp với phụ âm thì formant có đoạn uốn cong
hoặc chúc lên chúc xuống. Phụ âm là những chỗ không có những vệt ngang
thẫm là những chỗ tắc của phụ âm tắc vô thanh hoặc có nhưng mờ so với các
nguyên âm (các phụ âm mũi).

73
MỤC LỤC
Trang phụ bìa Trang
Lời cam đoan
Mục lục
Danh mục các ký hiệu, các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, biểu đồ, sơ đồ

MỞ ĐẦU................................................................................................................... 1
1. LÍ DO CHỌN ĐỀ TÀI.........................................................................................1
2. TỔNG QUAN.......................................................................................................3
3. MỤC ĐÍCH NGHIÊN CỨU..........................................................................1516
4. NHIỆM VỤ NGHIÊN CỨU..........................................................................1516
5. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU...............................................1617
6. PHƯƠNG PHÁP NGHIÊN CỨU.................................................................1617
7. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN....................................................2022
8. BỐ CỤC CỦA LUẬN ÁN..............................................................................2122
CHƯƠNG 1: CƠ SỞ LÍ THUYẾT...................................................................2224
1.1. Khái niệm formant của nguyên âm..............................................2224
1.2. Cấu tạo bộ máy phát âm của con người.......................................2426
1.3. Những đặc trưng vật lý của âm thanh tiếng nói..........................3032
1.3.1. Bản chất của âm........................................................................3032
1.3.2. Sóng âm.....................................................................................3133
1.3.3. Cao độ của âm thanh................................................................3134
1.3.4. Cường độ âm thanh...................................................................3235
1.3.5. Trường độ âm thanh..................................................................3436
1.4. Đặc trưng cấu âm của nguyên âm và phụ âm.............................3437
1.5. Cấu trúc âm tiết tiếng Việt và mối quan hệ giữa các đơn vị đoạn
tính và siêu đoạn tính trong âm tiết.....................................................4042
1.5.1. Cấu trúc âm tiết tiếng Việt.........................................................4042
1.5.2. Quan hệ giữa các đơn vị đoạn tính và siêu đoạn tính trong âm tiết
.............................................................................................................4648
CHƯƠNG 2: MỐI QUAN HỆ GIỮA FORMANT CỦA NGUYÊN ÂM VÀ
THANH ĐIỆU....................................................................................................4851

74
2.1. Trường độ formant của nguyên âm trong kết hợp với thanh điệu
.................................................................................................................4851
2.2. Vùng tần số formant của nguyên âm trong kết hợp với thanh điệu
.................................................................................................................5154
2.2.1. Vùng tần số của nguyên âm /i/......................................................11
2.2.2. Vùng tần số của nguyên âm /e/......................................................22
2.2.3. Vùng tần số của nguyên âm //......................................................23
2.2.4. Vùng tần số của nguyên âm //......................................................34
2.2.5. Vùng tần số của nguyên âm //......................................................44
2.2.6. Vùng tần số của nguyên âm /a/.....................................................45
2.2.7. Vùng tần số của nguyên âm /u/.....................................................56
2.2.8. Vùng tần số của nguyên âm /o/.....................................................67
2.2.9. Vùng tần số của nguyên âm //......................................................67
2.3. Diễn tiến formant của nguyên âm trong kết hợp với thanh điệu..78
2.3.1. Diễn tiến formant của nguyên âm trong kết hợp thanh ngang.....79
2.3.2. Diễn tiến formant của nguyên âm trong kết hợp thanh huyền. . .911
2.3.3. Diễn tiến formant của nguyên âm trong kết hợp thanh ngã.....1012
2.3.4. Diễn tiến formant của nguyên âm trong kết hợp thanh hỏi.....1113
2.3.5. Diễn tiến formant của nguyên âm trong kết hợp thanh sắc.....1114
2.3.6. Diễn tiến formant của nguyên âm trong kết hợp thanh nặng...1215
2.4. Tiểu kết............................................................................................1316
CHƯƠNG 3: FORMANT CỦA NGUYÊN ÂM..............................................1418
TRONG KẾT HỢP VỚI ÂM ĐẦU VÀ THANH ĐIỆU..................................1418
3.1. Formant của nguyên âm trong kết hợp với âm đầu /p, t, k/ và
thanh điệu...............................................................................................1418
3.1.1. Trường độ formant của nguyên âm...........................................1519
3.1.2. Vùng tần số formant của các nguyên âm..................................1923
3.1.3. Diễn tiến vùng chuyển tiếp tần số formant................................2226
3.2. Formant của nguyên âm trong kết hợp với âm đầu /m ,n, /.....2429
3.2.1. Trường độ formant của nguyên âm...........................................2631
3.2.2. Vùng tần số formant..................................................................2833
3.2.3. Diễn tiến vùng chuyển tiếp tần số formant................................3136
3.3. Thảo luận.........................................................................................3338
3.4. Tiểu kết............................................................................................3439
CHƯƠNG 4: FORMANT CỦA NGUYÊN ÂM...............................................3641
TRONG KẾT HỢP VỚI ÂM CUỐI.................................................................3641
4.1. Formant của nguyên âm trong kết hợp âm cuối /p, t, k/............3641
4.1.1. Trường độ formant của nguyên âm...........................................3742

75
4.1.2. Vùng tần số formant..................................................................4146
4.1.3. Diễn tiến vùng chuyển tiếp tần số formant................................4349
4.2. Formant của nguyên âm trong kết hợp âm cuối /m, n, /..........4551
4.2.1. Trường độ formant của nguyên âm...........................................4753
4.2.2. Vùng tần số formant của nguyên âm.........................................4854
4.2.3. Diễn tiến vùng chuyển tiếp formant của nguyên âm.................5056
4.3. Tiểu kết............................................................................................5359
KẾT LUẬN.........................................................................................................5561
DANH MỤC TÀI LIỆU THAM KHẢO..............................................................5965

76

Вам также может понравиться