SlideShare una empresa de Scribd logo
1 de 12
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 1
LỜI NÓI ĐẦU
Mục đích của báo cáo này là Tìm hiểu phương pháp phân tích đặc trưng tiếng nói.
Phân tích và thử nghiệm một ứng dụng liên quan nhận dạng tiếng nói.
Trích chọn các tham số đặc trưng là bước có ý nghĩa quyết định tới kết quả
của các chương trình nhận dạng tiếng nói. Có nhiều phương pháp trích chọn các tham
số đặc trưng nhưng nhìn chung các phương pháp này dựa trên hai cơ chế:
Mô phỏng lại quá trình cảm nhận âm thanh của tai người. Mô phỏng lại quá trình tạo
âm của cơ quan phát âm.
Dưới sự hướng dẫn tận tình của Cô Nguyễn Hoàng Lan em đã cố gắn hoàn thành tốt
bài tiểu luận. Nhưng trong quá trình thực hiện không tránh khỏi nhữnh sai sót, mong
thày góp ý để bài tiểu luận được hoàn thiện hơn.
Em xin chân thành cảm ơn !
Hà Nội, tháng 6 năm 2010.
HV: Nguyễn Ngọc Đăng
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 2
PHẦN I: NHỮNG VẤN ĐỀ CƠ BẢN CỦA TIẾNG NÓI
I. Bộ máy phát âm của con người
1. Cơ chế phát âm
Sơ đồ hệ thống phát âm của người được minh họa như hình vẽ:
Hình 1: Bộ máy phát âm
(1) Khoang mũi, (2) Vòm miệng cứng, (3) Ổ răng, (4) Vòm miệng mềm, (5)-(6)-(8)
Lưỡi, (7) Lưỡi gà, (9) Họng, (10) Nắp thanh quản, (11)-(12) Dây thanh âm, (13)
Thanh quản, (14) Thực quản, (15) Khí quản.
Hệ thống phát âm ở người bao gồm: phổi (lung), khí quản (trachea), thanh quản
(thanh quản), khoang miệng (oral cavity) và khoang mũi (nasal cavity). Thanh quản chứa
hai nếp gấp gọi là dây thanh âm (vocal cords), sẽ kéo căng khi phát ra tiếng nói. Khoang
miệng gồm một ống âm thanh (acoustic tube) dài khoảng 17 cm ở người nam, phần trước
kết thúc ở môi và phần sau kết thúc ở dây thanh âm hoặc thanh quản. Khoang miệng
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 3
đóng vai trò là một hộp cộng hưởng động, thể tích của nó có thể được điều khiển bởi bộ
máy phát âm ( môi, lưỡi, quai hàm, và vòm miệng mềm). Khoang mũi là một ống dài
khoảng 12 cm ở người nam, kết thúc ở lỗ mũi và vòm miệng mềm. Vòm miệng mềm
(velum) sẽ điều khiển hơi phát ra theo đường miệng hoặc đường mũi. Đối với những âm
không theo giọng mũi (non-nasalised), vòm miệng mềm sẽ đóng khoang mũi và hơi chỉ
phát ra theo đường miệng. Đối với những âm có giọng mũi, vòm miệng mềm sẽ dịch
chuyển xuống phía dưới, đóng đường miệng và hơi chỉ phát ra theo đường mũi. Trường
hợp thứ ba là hơi được phát ra theo cả hai đường.
Quá trình phát âm: khi nói, phổi chứa đầy không khí. Lượng không khí này sẽ được
đẩy qua khí quản và thanh môn (glottis). Luồng không khí qua thanh môn sẽ kích thích
dây thanh âm dao động tạo ra sự phát âm. Âm thanh này được truyền ra ngoài qua
khoang miệng và khoang mũi. Các khoang này có tác dụng như bộ lọc làm suy hao một
vài tần số trong khi cho các tần số khác đi qua.
2. Đặc trưng vật lý
- Độ cao:
Là mức độ cao thấp của âm, phụ thuộc vào sự chấn động nhanh hay chậm của không
khí trong một khoảng thời gian nhất định, được gọi là tần số dao động. Tần số dao động
càng lớn thì âm thanh càng cao.
- Độ mạnh:
Thường được gọi là cường độ, do biên độ dao động quyết định. Trong ngôn ngữ, phụ
âm thường mạnh hơn nguyên âm, đây chính là một trong những đặc điểm góp phần nhận
diện sự khác biệt giữa phụ âm và nguyên âm trong âm thanh tiếng nói.
- Độ dài:
Là trường độ của âm, phụ thuộc vào sự chấn động lâu hay mau của các phần tử không
khí. Độ dài được sử dụng để phân biệt các nguyên âm dài và ngắn, như phân biệt “a” với
“ă”, “ơ” với “â” trong tiếng Việt.
- Âm sắc:
Là sắc thái riêng của một âm do các cá thể khác nhau tạo ra. Âm sắc là nguyên nhân
gây ra sự khác biệt giữa giọng nói của người này với người khác. Âm sắc có được là do
hiện tượng cộng hưởng.
- Tiếng ồn và tiếng thanh:
Tiếng ồn là do sự chuyển động không nhịp nhàng (không có chu kỳ ổn định) của các
phần tử không khí gây ra. Tiếng thanh là do sự chuyển động nhịp nhàng (có chu kỳ ổn
định) của các phần tử không khí gây ra.
3. Phân loại tiếng nói
- Âm hữu thanh:
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 4
Được tạo ra khi dây thanh âm căng lên và rung khi áp suất không khí tăng lên, làm cho
thanh môn mở ra rồi đóng lại khi luồng không khí đi qua. Bộ phận phát âm hoạt động
giống như hộp cộng hưởng, khuyếch đại những thành phần hài này và làm suy giảm
những thành phần hài khác để tạo ra âm hữu thanh. Mức độ rung của dây thanh âm tùy
thuộc vào áp suất không khí ở phổi và sức căng của dây thanh âm. Người nói có thể điều
khiển 2 yếu tố trên để thày đổi chu kì cơ bản (được gọi là pitch) của âm thanh. Ở người
đàn ông, tần số cơ bản khoảng từ 50÷250 Hz, trong khi ở phụ nữ là thường rơi vào
khoảng 120÷500 Hz.
Trong ngôn ngữ, các nguyên âm về bản chất âm học là những âm hữu thanh.
- Âm vô thanh:
Được tạo ra khi dây thanh âm không rung. Có hai loại âm vô thanh cơ bản: âm xát và
âm bật hơi.
 Đối với âm xát, ví dụ khi nói “s”, “x”, một số điểm trên bộ phận phát âm bị co
lại khi luồng không khí đi ngang qua nó, hỗn loạn xảy ra tạo nên nhiễu ngẫu
nhiên. Bởi vì những điểm co thường ở phía trước miệng, cộng hưởng của bộ
phận phát âm có ảnh hưởng nhỏ đến đặc tính của âm xát.
 Đối với âm bật hơi, như khi ta nói ‘h’ trong ₡hùng?, hỗn loạn xảy ra ở gần
thanh môn khi dây thanh âm bị giữ nhẹ một phần. Trường hợp này, cộng hưởng
của bộ phận phát âm sẽ biến điệu phổ của nhiễu ngẫu nhiên. Hiệu ứng này có
thể nghe rõ khi nói thì thầm.
Cấu tạo cơ bản của phụ âm trong mọi ngôn ngữ là âm vô thanh.
Ngoài hai loại âm cơ bản ở trên, còn có một loại âm trung gian vừa mang tính chất
nguyên âm, vừa mang tính chất phụ âm, được gọi là bán nguyên âm hay bán phụ âm. Ví
dụ như âm ‘i’ và ‘u’ trong những từ ‘ai’, ‘âu’.
- Âm bật hơi:
Khi phát các âm này, bộ máy phát âm sẽ được đóng lại hoàn toàn tại một điểm nào đó
trong bộ máy phát âm. Ap suất không khí trong bộ máy phát âm sẽ tăng lên tức thời và
được giải phóng một cách đột ngột. Sự giải thoát nhanh chóng của áp suất này sẽ tạo nên
một sự kích thích tạm thời của bộ máy phát âm.
4. Mô hình lọc nguồn tạo tiếng nói
(Hình 2) minh họa mô hình rất đơn giản của bộ phận phát ra nguyên âm “e” là một ống
đều có chiều dài L, một đầu nguồn âm thanh(dây thanh âm) và đầu kia được mở ra(môi).
Ống này cộng hưởng ở các tần số lẻ f0, 3f0, 5f0… với f0=c/4L với c là vận tốc âm thanh
trong không khí. Ví dụ, L=17cm, c=300m/s, thì sẽ cộng hưởng ở các tần số: 500Hz,
1500Hz, 2500Hz,… những đỉnh cộng hưởng này được gọi là các Formant. Bộ phận phát
âm có thể nhiều dạng khác nhau và tạo ra những đỉnh cộng hưởng khác nhau hay các giá
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 5
trị Formant khác nhau nên âm thanh phát ra khác nhau. Trong tiếng nói, các tần số
Formant luôn thay đổi từ âm này sang âm khác.
Hình 2: Mô hình ống đều của bộ phận phát âm
Quá trình hình thành tiếng nói được biểu diễn bằng mô hình Source-filter:
Hình 3: Tạo tiếng nói theo mô hình lọc nguồn
Tín hiệu vào là tín hiệu từ nguồn âm thanh(cũng có thể là có chu kì hay nhiễu) được
lọc bằng bộ lọc có tính chất cộng hưởng tương tự với bộ phận phát âm. Phổ của tín hiệu
tiếng nói thu được bằng cách nhân phổ của bộ lọc với phổ của tín hiệu. AV, AN là các độ
lợi biểu thị cường độ của âm thanh và cường độ nhiễu.
Một bộ phận phát âm có một số hữu hạn Formant, nhưng chỉ cần quan tâm đến 3 hay 4
Formant đầu tiên trên băng tần từ 100Hz đến 3.5kHz do biên độ của các Formant cao hơn
bị suy giảm gần như hoàn toàn với độ suy giảm -12dB/octave. Trường hợp tiếng nói vô
thanh, phổ tương đối bằng phẳng, số lượng các Formant như vậy vẫn đủ mặc dù tiếng nói
vô thanh có băng tần mở rộng lên đến 7-8kHz. Ngoài ra, do ảnh hưởng bức xạ của miệng
nên biên độ được tăng lên chừng 6dB/octave trong băng tần 0-3kHz. Chình vì vậy mà
đến phần tiền xử lý tín hiệu ta phải dùng bộ lọc tiền nhấn để bù thêm +6dB/octave.
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 6
II. Cơ quan thính giác của con người:
1. Cấu tạo
Hình 4: Cấu tạo cơ quan thính giác
Tai ngoài:
Bao gồm có vành tai và lỗ tai, chính lỗ tai sẽ dẫn tín hiệu âm thanh đến màng nhĩ và
làm cho màng nhĩ rung lên. Độ lệch của màng nhĩ khoảng chừng vài nanomet và một
tiếng nói thầm có thể tạo ra một độ lệch chỉ bằng một phần mười bán kính nguyên tử
hydro.
Tai giữa:
Có một xương nhỏ gọi là xương búa áp sát vào màng nhĩ. Trong lúc màng nhĩ rung
lên, vì xương búa liên kết với các xương khác, gọi là xương đe, làm xương này có thể
quay. Trong lúc quay, xương đe lại liên kết với một xương khác, gọi là xương bàn đạp,
nó áp sát vào cửa sổ hình ovan của vùng trong tai. Ba xương này (búa, đe, bàn đạp) là
những xương nhỏ nhất trong cơ thể con người và được gọi chung là xương nhỏ. Chức
năng của nó là truyền tải sự rung động của màng nhĩ đến cửa sổ hình oval ở trong tai.
Tai trong:
Cửa sổ hình oval là một màng phủ nhầy, mở rộng trong bức tường xương có cấu trúc
xoắn ốc, được gọi là ốc tai. Chất lỏng trong ốc tai được chia theo chiều dài của nó thành
hai màng nhầy, gọi là màng nhầy Reissner và màng nhầy cơ bản(màng đáy). Sự rung
động của cửa sổ oval gây nên sóng áp suất truyền đến chất lỏng ở trong xương nhỏ và áp
suất của sóng gây trên màng nhầy cơ bản một độ lệch tại những điểm khác nhau dọc theo
chiều dài của nó. Áp chặt vào màng nhầy cơ bản là cơ quan vỏ não. Cơ quan này chứa
khoảng 30000 tế bào hình sợi. Mỗi tế bào này có nhiều sợi nhỏ li ti nhô ra. Các sợi dây
này uốn cong nhờ sự vận động của màng nhầy cơ bản và nhờ đó các tế bào hình sợi hoạt
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 7
động. Các tế bào hình sợi này liên kết với các đầu cuối của nơron của hệ thần kinh để
truyền tín hiệu về não.
2. Cơ chế nghe
Khi ta nghe một sóng âm thuần tuý tức âm đơn (sóng sine), những điểm khác nhau
trên màng đáy sẽ rung động thao tần số của âm đơn đi vào tai. Điểm lệch lớn nhất trên
màng đáy phụ thuộc tần số âm đơn. Tần số càng cao tạo ra điểm lệch lớn nhất ở phía đáy
và tần số thấp tạo ra điểm lệch lớn nhất phía đỉnh. Như vậy màng đáy đóng vai trò phân
tích tần số tín hiệu vào phức tạp, bằng cách tách những tần số khác nhau ở những điểm
khác nhau dọc theo chiều dài của nó. Mỗi điểm như vậy có thể xem là một bộ lọc thông
dải có tần số trung tâm và băng thông xác định. Những đáp ứng này không đối xứng
quanh tần số trung tâm, vùng tần số cao có tốc độ suy giảm dốc hơn nhiều so với vùng
tần số thấp. Vị trí của độ lệch cực đại dọc theo màng nhày biến thiên phi tuyến theo tần
số (theo hàm logarit).
Những nghiên cứu chỉ ra rằng ngưỡng nghe của một âm đơn tăng lên khi có sự hiện
diện của những âm đơn lân cận khác (âm mặt nạ) và chỉ có băng tần hẹp xung quanh
âm đơn mới tham gia vào hiệu ứng mặ nạ, băng tần này thường gọi là băng tần tới hạn.
Giá trị của băng tần tới hạn phụ thuộc vào tan số của âm đơn cần thử. Với âm đơn
100Hz, băng tần tới hạn xấp xỉ 90Hz, với âm đơn 5kHz là xấp xỉ 1kHz.
Có thể xem quá trình nghe của hệ thính giác là một dãy cac bộ lọc băng thông, có đáp
ứng phủ lấp lên nhau và băng thông hiệu quả của chúng xấp xỉ băng thông tới hạn. Đây
là cơ sở cho việc thiết kế dãy băng lọc sau này
III. Ngữ âm tiếng Việt
1. Âm vị
Về mặt ngôn ngữ học, có thể xem tiếng nói là một chuỗi các âm cơ bản được gọi là âm
vị. Âm vị là đơn vị ngôn ngữ trừu tượng và không thể quan sát trực tiếp trong tín hiệu
tiếng nói. Nhiều âm vị khác nhau kết hợp với nhau một cách nào đó để tạo ra những âm
thanh khác nhau.
2. Nguyên âm
Nguyên âm được xác định bởi hốc cộng hưởng khoang miệng và hốc yết hầu-nguồn
gốc của các Formant. Khoang miệng và khoang yết hầu được tách biệt ra bởi lưỡi. Do đó,
sự thay đổi của khoang này đồng nghĩa với sự thay đổi của khoang kia. Việc xác định thể
tích, hình dáng, lối thoát không khí của những hốc cộng hưởng này, tức xác định khả
năng cộng hưởng của chúng, chính là mô tả độ mở của miệng, vị trí của lưỡi và hình
dáng của môi.
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 8
a. Phụ âm
Đặc điểm cơ bản của phụ âm là sự cấu tạo bằng luồng không khí bị cản trở, sự cản trở
này diễn ra với những mức độ khác nhau, cách thức khác nhau và ở những bộ phận khác
nhau của cơ quan phát âm. Phụ âm đuợc chia ra phụ âm tắc (như ‘p’, ‘t’, ‘đ’, ‘b’) và phụ
âm xát(như ‘v’, ‘s’, ‘x’)
 Phụ âm tắc: Đặc trưng là một tiếng nổ, do luồng không khí bị cản trở hoàn toàn,
phải phá vỡ sự cản trở để thoát ra ngoài. Phụ âm tắc được chia làm phụ âm bật
hơi (như ‘th’)và phụ âm mũi (như ‘m’, ‘n’, ‘ng’, ‘nh’).
 Phụ âm xát: Đặc trưng là tiếng cọ xát, phát sinh do luồng không khi đi ra bị cản
trở không hoàn toàn(chỉ bị khó khăn) phải lách qua một khe hở nhỏ và trong khi
thoát ra ngoài cọ xát vào thành của bộ phận phát âm.
b.Thanh điệu
Thanh điệu là sự nâng cao hay hạ thấp “giọng nói” trong một âm tiết. Âm tiết là đơn
vị phát âm nhỏ nhất, trong tiếng Việt âm tiết là một từ. Thanh điệu là sự thay đổi cao độ
của giọng nói, điều đó có nghĩa thay đổi biên độ tần số cơ bản trong âm hữu thanh.
Thanh điệu được xác định bằng tần số cơ bản.
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 9
PHẦN II: CÁC PHƯƠNG PHÁP TRÍCH CHỌN THAM SỐ ĐẶC TRƯNG
CỦA TIẾNG NÓI
Qua phần phân tích ngữ âm, ta thấy rằng, khi phát âm một từ (tổng quát gồm phụ âm,
nguyên âm, thanh điệu), dây thanh âm rung tạo ra dạng sóng của luồng không khí, đến
lượt bộ phận cấu âm và mũi biến đổi chậm làm thay đổi dạng sóng phát ra bên ngoài để
tạo ra những từ khác nhau. Như vậy tín hiệu tiếng nói là do xung bước sóng chập với tín
hiệu biến thiên chậm của bộ phận cấu âm. Điều này dẫn tới việc trích tham số tiếng nói
rất hiệu quả là phân tích cepstral, trong phương pháp này người ta muốn lấy phần tín
hiệu có tần số thấp do bộ phận cấu âm tạo ra.
I. Phân tích cepstral theo thang đo mel
Phương pháp tính các hệ số MFCC là phương pháp trích chọn tham số tiếng nói
được sử dụng rộng rãi bởi tính hiệu quả của nó thông qua phân tích cepstral theo thang
đo mel.
Phương pháp được xây dựng dựa trên sự cảm nhận của tai người đối với các dải tần số
khác nhau. Với các tần số thấp (dưới 1000 Hz), độ cảm nhận của tai người là tuyến
tính. Đối với các tần số cao, độ biến thiên tuân theo hàm logarit. Các băng lọc tuyến
tính ở tần số thấp và biến thiên theo hàm logarit ở tần số cao được sử dụng để trích
chọn các đặc trưng âm học quan trọng của tiếng nói. Mô hình tính toán các hệ số MFCC
được mô tả như (Hình 5).
Hình 5: Sơ đồ tính toán các hệ số MFCC
Ý nghĩa và phương pháp xác định tham số ở các khối trong sơ đồ trên mô tả như sau:
Khối 1: Bộ lọc hiệu chỉnh (Preemphasis)
Tín hiệu tiếng nói s(n) được đưa qua bộ lọc số bậc thấp để phổ đồng đều hơn, giảm
ảnh hưởng gây ra cho các xử lý tín hiệu sau này. Thường bộ lọc này cố định bậc một, có
dạng:
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 10
H(z) = 1 – az-1 0.9 ≤ a ≤ 1.0
Quan hệ giữa tín hiệu ra với tín hiệu vào tuân theo phương trình
~
s (n) = s(n)-a.s(n-1)
Giá trị a thường được chọn là 0.97.
Khối 2: Phân khung (Frame Blocking)
Trong khối này tín hiệu hiệu chỉnh được phân thành các khung, mỗi khung
có N mẫu; hai khung kề lệch nhau M mẫu. Khung đầu tiên chứa N mẫu, khung thứ hai
bắt đầu chậm hơn khung thứ nhất M mẫu và chồng lên khung thứ nhất N-M mẫu. Tương
tự, khung thứ ba chậm hơn khung thứ nhất 2M mẫu (chậm hơn khung thứ hai M mẫu) và
chờm lên khung thứ nhất N-2M mẫu. Quá trình này tiếp tục cho đến khi tất cả các mẫu
tiếng nói cần phân tích thuộc về một hoặc nhiều khung.
Khối 3: Lấy cửa sổ (Windowing)
Bước tiếp theo là lấy cửa sổ cho mỗi khung riêng rẽ nhằm giảm sự gián đoạn của tín
hiệu tiếng nói tại đầu và cuối mỗi khung. Nếu w(n), 0  n  N-1
Thông thường, của sổ Hamming được sử dụng. Cửa sổ này có dạng:
Khối 4: Biến đổi Fourier rời rạc (FFT)
Tác dụng của FFT là chuyển đổi mỗi khung với N mẫu từ miền thời gian sang miền
tần số. FFT là thuật toán tính DFT nhanh. DFT được xác định
Khối 5: Biến đổi sang thang đo Mel trên miền tần số
Như đã nói ở trên, tai người không cảm nhận sự thay đổi tần số của tiếng nói tuyến
tínhmà theo thang Mel. Người ta chọn tấn số 1kHz, 40 dB trên ngưỡng nghe là 1000
Mel. Do đó, công thức gần đúng biểu diễn quan hệ tần số ở thang mel và thang tuyến
tính như sau:
Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 11
Hình 6: Các băng lọc tam giác theo tần số Mel
Một phương pháp để chuyển đổi sang thang mel là sử dụng băng lọc (Hình 6), trong
đó mỗi bộ lọc có đáp ứng tần số dạng tam giác. Số băng lọc sử dụng thường trên 20
băng. Thông thường, người ta chọn tần số từ 0 dến Fs/2 (Fs là tần số lấy mẫu tiếng
nói). Nhưng cũng có thể một dải tần giới hạn từ LOFREQ đến HIFREQ sẽ được dùng
để lọc đi các tần số không cần thiết cho xử lý. Chẳng hạn, trong xử lý tiếng nói qua
đường điện thoại có thể lấy giới hạn dải tần từ LOFREQ=300 đến HIFREQ=3400.
Sau khi tính FFT ta thu được phổ tín hiệu S(fn) . Thực chất đây là một dãy năng lượng
W(m)=|s(fn)|2. Cho W(m) đi qua một dãy K băng lọc dạng tam giác, ta được một dãy các
. Tính tổng của các dãy trong từng băng lọc, ta thu được một dãy các hệ số
mk(k=1,2,3…,K).
Khối 6: Biến đổi Cosine rời rạc (DCT)Trong bước này ta sẽ chuyển log của các giá
trị mk về miền thời gian bằng cách biến đổi Cosine rời rạc (DCT). Kết quả của phép biến
đổi này ta thu được các hệ số MFCC.
Thông thường, chỉ có một số giá trị đầu tiên của ci được sử dụng. Trong các ứng dụng
nhận dạng tiếng nói, người ta thường lấy 12 hệ số MFCC và thêm 1 hệ số năng lượng của
khung sau khi đã được chuẩn hóa làm tham số đặc trưng cho tín hiệu tiếng nói (như vậy
tổng cộng có Q=13 hệ số).
Khối 7: Cepstral có trọng số
Vì độ nhạy của các hệ số cepstral bậc thấp làm cho phổ toàn bộ bị đổ dốc, độ nhạy của
các cepstral bậc cao gây ra nhiễu nên người ta thường sử dụng cửa sổ cepstral để cực tiểu
hóa độ nhạy này. Công thức biểu diễn các hệ số cepstral có trọng số:
Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan
Học Viên: Nguyễn Ngọc Đăng 12
DOWNLOAD ĐỂ XEM ĐẦY ĐỦ NỘI DUNG
MÃ TÀI LIỆU: 51555
DOWNLOAD: + Link tải: Xem bình luận
Hoặc : + ZALO: 0932091562

Más contenido relacionado

Similar a Đề tài: Tìm hiểu các phương pháp phân tích đặc trưng tiếng nói, HAY

Bản chất ngữ âm
Bản chất ngữ âmBản chất ngữ âm
Bản chất ngữ âmBích Phương
 
ngữ âm
ngữ âmngữ âm
ngữ âmatcak11
 
Lythuyet an tomtat
Lythuyet an tomtatLythuyet an tomtat
Lythuyet an tomtatDuy Vọng
 
Lythuyet an tomtat
Lythuyet an tomtatLythuyet an tomtat
Lythuyet an tomtatDuy Vọng
 
CÁCH KHÁM HÔ HẤP Ở TRẺ EM
CÁCH KHÁM HÔ HẤP Ở TRẺ EMCÁCH KHÁM HÔ HẤP Ở TRẺ EM
CÁCH KHÁM HÔ HẤP Ở TRẺ EMSoM
 
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...tcoco3199
 
âm tố và hiện tượng ngôn điệu
âm tố và hiện tượng ngôn điệuâm tố và hiện tượng ngôn điệu
âm tố và hiện tượng ngôn điệuatcak11
 
âm Tố Và Hiện Tượng Ngôn điệu
âm Tố Và Hiện Tượng Ngôn điệuâm Tố Và Hiện Tượng Ngôn điệu
âm Tố Và Hiện Tượng Ngôn điệuatcak11
 
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.doc
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.docNghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.doc
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.docDịch vụ viết đề tài trọn gói 0934.573.149
 
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptx
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptxLy Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptx
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptxBình Thanh
 
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔIthuyet le
 
Am hoc kien truc
Am hoc kien trucAm hoc kien truc
Am hoc kien trucDang Lam
 
PPT Ngữ âm học - Dẫn luận ngôn ngữ
PPT Ngữ âm học - Dẫn luận ngôn ngữPPT Ngữ âm học - Dẫn luận ngôn ngữ
PPT Ngữ âm học - Dẫn luận ngôn ngữCaoThuNgan
 
Sinh lí học hô hấp
Sinh lí học hô hấpSinh lí học hô hấp
Sinh lí học hô hấpVuKirikou
 
Sieu am long_nguc.ykhoabooks,com
Sieu am long_nguc.ykhoabooks,comSieu am long_nguc.ykhoabooks,com
Sieu am long_nguc.ykhoabooks,comPhan Cong Binh
 

Similar a Đề tài: Tìm hiểu các phương pháp phân tích đặc trưng tiếng nói, HAY (20)

Phcn ngon ngu
Phcn ngon nguPhcn ngon ngu
Phcn ngon ngu
 
Bản chất ngữ âm
Bản chất ngữ âmBản chất ngữ âm
Bản chất ngữ âm
 
ngữ âm
ngữ âmngữ âm
ngữ âm
 
Lythuyet an tomtat
Lythuyet an tomtatLythuyet an tomtat
Lythuyet an tomtat
 
Ly thuyet-am-nhac-co-ban
Ly thuyet-am-nhac-co-banLy thuyet-am-nhac-co-ban
Ly thuyet-am-nhac-co-ban
 
Lythuyet an tomtat
Lythuyet an tomtatLythuyet an tomtat
Lythuyet an tomtat
 
Ly thuyet am_nhac_co_ban1_3279
Ly thuyet am_nhac_co_ban1_3279Ly thuyet am_nhac_co_ban1_3279
Ly thuyet am_nhac_co_ban1_3279
 
CÁCH KHÁM HÔ HẤP Ở TRẺ EM
CÁCH KHÁM HÔ HẤP Ở TRẺ EMCÁCH KHÁM HÔ HẤP Ở TRẺ EM
CÁCH KHÁM HÔ HẤP Ở TRẺ EM
 
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...
Luận Văn Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn...
 
âm tố và hiện tượng ngôn điệu
âm tố và hiện tượng ngôn điệuâm tố và hiện tượng ngôn điệu
âm tố và hiện tượng ngôn điệu
 
âm Tố Và Hiện Tượng Ngôn điệu
âm Tố Và Hiện Tượng Ngôn điệuâm Tố Và Hiện Tượng Ngôn điệu
âm Tố Và Hiện Tượng Ngôn điệu
 
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.doc
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.docNghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.doc
Nghiên Cứu Khả Năng Nghe - Hiểu Của Trẻ Cấy Điện Cực Ốc Tai Sau Huấn Luyện.doc
 
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptx
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptxLy Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptx
Ly Sinh Bai 3456-Le Thi Cam Tuyen - DNC.pptx
 
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI
2020.HƯỚNG DẨN KHÁM LÂM SÀNG HÔ HẤP TRẺ EM. Phần 3 - NGHE PHỔI
 
Am hoc kien truc
Am hoc kien trucAm hoc kien truc
Am hoc kien truc
 
Am hoc kien truc
Am hoc kien trucAm hoc kien truc
Am hoc kien truc
 
KHSS.pptx
KHSS.pptxKHSS.pptx
KHSS.pptx
 
PPT Ngữ âm học - Dẫn luận ngôn ngữ
PPT Ngữ âm học - Dẫn luận ngôn ngữPPT Ngữ âm học - Dẫn luận ngôn ngữ
PPT Ngữ âm học - Dẫn luận ngôn ngữ
 
Sinh lí học hô hấp
Sinh lí học hô hấpSinh lí học hô hấp
Sinh lí học hô hấp
 
Sieu am long_nguc.ykhoabooks,com
Sieu am long_nguc.ykhoabooks,comSieu am long_nguc.ykhoabooks,com
Sieu am long_nguc.ykhoabooks,com
 

Más de Dịch Vụ Viết Thuê Khóa Luận Zalo/Telegram 0917193864

Más de Dịch Vụ Viết Thuê Khóa Luận Zalo/Telegram 0917193864 (20)

List 200 Đề Tài Báo Cáo Thực Tập Ngành Digital Marketing, 9 Điểm Từ Sinh Viên...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Digital Marketing, 9 Điểm Từ Sinh Viên...List 200 Đề Tài Báo Cáo Thực Tập Ngành Digital Marketing, 9 Điểm Từ Sinh Viên...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Digital Marketing, 9 Điểm Từ Sinh Viên...
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Khách Sạn, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Khách Sạn, Điểm Cao Mới NhấtList 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Khách Sạn, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Khách Sạn, Điểm Cao Mới Nhất
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Lữ Hành, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Lữ Hành, Điểm Cao Mới NhấtList 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Lữ Hành, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Du Lịch Lữ Hành, Điểm Cao Mới Nhất
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại HọcList 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại HọcList 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Nghiệp, Từ Các Trường Đại Học
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Trình, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Trình, Từ Các Trường Đại HọcList 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Trình, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Công Trình, Từ Các Trường Đại Học
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Tử Viễn Thông, 9 Điểm
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Tử Viễn Thông, 9 ĐiểmList 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Tử Viễn Thông, 9 Điểm
List 200 Đề Tài Báo Cáo Thực Tập Ngành Điện Tử Viễn Thông, 9 Điểm
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Đông Phương Học, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Đông Phương Học, Điểm Cao Mới NhấtList 200 Đề Tài Báo Cáo Thực Tập Ngành Đông Phương Học, Điểm Cao Mới Nhất
List 200 Đề Tài Báo Cáo Thực Tập Ngành Đông Phương Học, Điểm Cao Mới Nhất
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hệ Thống Thông Tin, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hệ Thống Thông Tin, Từ Các Trường Đại HọcList 200 Đề Tài Báo Cáo Thực Tập Ngành Hệ Thống Thông Tin, Từ Các Trường Đại Học
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hệ Thống Thông Tin, Từ Các Trường Đại Học
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hướng Dẫn Viên Du Lịch, 9 Điểm
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hướng Dẫn Viên Du Lịch, 9 ĐiểmList 200 Đề Tài Báo Cáo Thực Tập Ngành Hướng Dẫn Viên Du Lịch, 9 Điểm
List 200 Đề Tài Báo Cáo Thực Tập Ngành Hướng Dẫn Viên Du Lịch, 9 Điểm
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Quốc Tế, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Quốc Tế, Từ Sinh Viên Khá GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Quốc Tế, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Quốc Tế, Từ Sinh Viên Khá Giỏi
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Thương Mại, Từ Sinh Viên Kh...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Thương Mại, Từ Sinh Viên Kh...List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Thương Mại, Từ Sinh Viên Kh...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Doanh Thương Mại, Từ Sinh Viên Kh...
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Đầu Tư, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Đầu Tư, Từ Sinh Viên Khá GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Đầu Tư, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Đầu Tư, Từ Sinh Viên Khá Giỏi
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Quốc Tế, Điểm Cao Từ Các Trườn...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Quốc Tế, Điểm Cao Từ Các Trườn...List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Quốc Tế, Điểm Cao Từ Các Trườn...
List 200 Đề Tài Báo Cáo Thực Tập Ngành Kinh Tế Quốc Tế, Điểm Cao Từ Các Trườn...
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành May Thời Trang, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành May Thời Trang, Từ Sinh Viên Khá GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành May Thời Trang, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành May Thời Trang, Từ Sinh Viên Khá Giỏi
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Ngôn Ngữ Anh, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Ngôn Ngữ Anh, Từ Sinh Viên Khá GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành Ngôn Ngữ Anh, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Ngôn Ngữ Anh, Từ Sinh Viên Khá Giỏi
 
List 200 đề tài báo cáo thực tập ngành ngôn ngữ nhật, từ các trường đại học
List 200 đề tài báo cáo thực tập ngành ngôn ngữ nhật, từ các trường đại họcList 200 đề tài báo cáo thực tập ngành ngôn ngữ nhật, từ các trường đại học
List 200 đề tài báo cáo thực tập ngành ngôn ngữ nhật, từ các trường đại học
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Công Chúng, Từ Khóa Trước
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Công Chúng, Từ Khóa TrướcList 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Công Chúng, Từ Khóa Trước
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Công Chúng, Từ Khóa Trước
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Quốc Tế, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Quốc Tế, Từ Sinh Viên Khá GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Quốc Tế, Từ Sinh Viên Khá Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quan Hệ Quốc Tế, Từ Sinh Viên Khá Giỏi
 
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quản Lý Công, 9 Điểm Từ Sinh Viên Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quản Lý Công, 9 Điểm Từ Sinh Viên GiỏiList 200 Đề Tài Báo Cáo Thực Tập Ngành Quản Lý Công, 9 Điểm Từ Sinh Viên Giỏi
List 200 Đề Tài Báo Cáo Thực Tập Ngành Quản Lý Công, 9 Điểm Từ Sinh Viên Giỏi
 

Último

powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgsNmmeomeo
 
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảoKiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảohoanhv296
 
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhkinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhdtlnnm
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docxTHAO316680
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfTrnHoa46
 
CD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh choCD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh chonamc250
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanmyvh40253
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdfTrnHoa46
 
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-KhnhHuyn546843
 
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxNhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxhoangvubaongoc112011
 
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoáCác điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoámyvh40253
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfhoangtuansinh1
 
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...hoangtuansinh1
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfNguyen Thanh Tu Collection
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...Nguyen Thanh Tu Collection
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngYhoccongdong.com
 

Último (20)

powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
 
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảoKiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảo
 
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhkinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
 
CD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh choCD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh cho
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdf
 
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
 
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxNhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
 
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoáCác điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
 
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
 

Đề tài: Tìm hiểu các phương pháp phân tích đặc trưng tiếng nói, HAY

  • 1. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 1 LỜI NÓI ĐẦU Mục đích của báo cáo này là Tìm hiểu phương pháp phân tích đặc trưng tiếng nói. Phân tích và thử nghiệm một ứng dụng liên quan nhận dạng tiếng nói. Trích chọn các tham số đặc trưng là bước có ý nghĩa quyết định tới kết quả của các chương trình nhận dạng tiếng nói. Có nhiều phương pháp trích chọn các tham số đặc trưng nhưng nhìn chung các phương pháp này dựa trên hai cơ chế: Mô phỏng lại quá trình cảm nhận âm thanh của tai người. Mô phỏng lại quá trình tạo âm của cơ quan phát âm. Dưới sự hướng dẫn tận tình của Cô Nguyễn Hoàng Lan em đã cố gắn hoàn thành tốt bài tiểu luận. Nhưng trong quá trình thực hiện không tránh khỏi nhữnh sai sót, mong thày góp ý để bài tiểu luận được hoàn thiện hơn. Em xin chân thành cảm ơn ! Hà Nội, tháng 6 năm 2010. HV: Nguyễn Ngọc Đăng
  • 2. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 2 PHẦN I: NHỮNG VẤN ĐỀ CƠ BẢN CỦA TIẾNG NÓI I. Bộ máy phát âm của con người 1. Cơ chế phát âm Sơ đồ hệ thống phát âm của người được minh họa như hình vẽ: Hình 1: Bộ máy phát âm (1) Khoang mũi, (2) Vòm miệng cứng, (3) Ổ răng, (4) Vòm miệng mềm, (5)-(6)-(8) Lưỡi, (7) Lưỡi gà, (9) Họng, (10) Nắp thanh quản, (11)-(12) Dây thanh âm, (13) Thanh quản, (14) Thực quản, (15) Khí quản. Hệ thống phát âm ở người bao gồm: phổi (lung), khí quản (trachea), thanh quản (thanh quản), khoang miệng (oral cavity) và khoang mũi (nasal cavity). Thanh quản chứa hai nếp gấp gọi là dây thanh âm (vocal cords), sẽ kéo căng khi phát ra tiếng nói. Khoang miệng gồm một ống âm thanh (acoustic tube) dài khoảng 17 cm ở người nam, phần trước kết thúc ở môi và phần sau kết thúc ở dây thanh âm hoặc thanh quản. Khoang miệng
  • 3. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 3 đóng vai trò là một hộp cộng hưởng động, thể tích của nó có thể được điều khiển bởi bộ máy phát âm ( môi, lưỡi, quai hàm, và vòm miệng mềm). Khoang mũi là một ống dài khoảng 12 cm ở người nam, kết thúc ở lỗ mũi và vòm miệng mềm. Vòm miệng mềm (velum) sẽ điều khiển hơi phát ra theo đường miệng hoặc đường mũi. Đối với những âm không theo giọng mũi (non-nasalised), vòm miệng mềm sẽ đóng khoang mũi và hơi chỉ phát ra theo đường miệng. Đối với những âm có giọng mũi, vòm miệng mềm sẽ dịch chuyển xuống phía dưới, đóng đường miệng và hơi chỉ phát ra theo đường mũi. Trường hợp thứ ba là hơi được phát ra theo cả hai đường. Quá trình phát âm: khi nói, phổi chứa đầy không khí. Lượng không khí này sẽ được đẩy qua khí quản và thanh môn (glottis). Luồng không khí qua thanh môn sẽ kích thích dây thanh âm dao động tạo ra sự phát âm. Âm thanh này được truyền ra ngoài qua khoang miệng và khoang mũi. Các khoang này có tác dụng như bộ lọc làm suy hao một vài tần số trong khi cho các tần số khác đi qua. 2. Đặc trưng vật lý - Độ cao: Là mức độ cao thấp của âm, phụ thuộc vào sự chấn động nhanh hay chậm của không khí trong một khoảng thời gian nhất định, được gọi là tần số dao động. Tần số dao động càng lớn thì âm thanh càng cao. - Độ mạnh: Thường được gọi là cường độ, do biên độ dao động quyết định. Trong ngôn ngữ, phụ âm thường mạnh hơn nguyên âm, đây chính là một trong những đặc điểm góp phần nhận diện sự khác biệt giữa phụ âm và nguyên âm trong âm thanh tiếng nói. - Độ dài: Là trường độ của âm, phụ thuộc vào sự chấn động lâu hay mau của các phần tử không khí. Độ dài được sử dụng để phân biệt các nguyên âm dài và ngắn, như phân biệt “a” với “ă”, “ơ” với “â” trong tiếng Việt. - Âm sắc: Là sắc thái riêng của một âm do các cá thể khác nhau tạo ra. Âm sắc là nguyên nhân gây ra sự khác biệt giữa giọng nói của người này với người khác. Âm sắc có được là do hiện tượng cộng hưởng. - Tiếng ồn và tiếng thanh: Tiếng ồn là do sự chuyển động không nhịp nhàng (không có chu kỳ ổn định) của các phần tử không khí gây ra. Tiếng thanh là do sự chuyển động nhịp nhàng (có chu kỳ ổn định) của các phần tử không khí gây ra. 3. Phân loại tiếng nói - Âm hữu thanh:
  • 4. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 4 Được tạo ra khi dây thanh âm căng lên và rung khi áp suất không khí tăng lên, làm cho thanh môn mở ra rồi đóng lại khi luồng không khí đi qua. Bộ phận phát âm hoạt động giống như hộp cộng hưởng, khuyếch đại những thành phần hài này và làm suy giảm những thành phần hài khác để tạo ra âm hữu thanh. Mức độ rung của dây thanh âm tùy thuộc vào áp suất không khí ở phổi và sức căng của dây thanh âm. Người nói có thể điều khiển 2 yếu tố trên để thày đổi chu kì cơ bản (được gọi là pitch) của âm thanh. Ở người đàn ông, tần số cơ bản khoảng từ 50÷250 Hz, trong khi ở phụ nữ là thường rơi vào khoảng 120÷500 Hz. Trong ngôn ngữ, các nguyên âm về bản chất âm học là những âm hữu thanh. - Âm vô thanh: Được tạo ra khi dây thanh âm không rung. Có hai loại âm vô thanh cơ bản: âm xát và âm bật hơi.  Đối với âm xát, ví dụ khi nói “s”, “x”, một số điểm trên bộ phận phát âm bị co lại khi luồng không khí đi ngang qua nó, hỗn loạn xảy ra tạo nên nhiễu ngẫu nhiên. Bởi vì những điểm co thường ở phía trước miệng, cộng hưởng của bộ phận phát âm có ảnh hưởng nhỏ đến đặc tính của âm xát.  Đối với âm bật hơi, như khi ta nói ‘h’ trong ₡hùng?, hỗn loạn xảy ra ở gần thanh môn khi dây thanh âm bị giữ nhẹ một phần. Trường hợp này, cộng hưởng của bộ phận phát âm sẽ biến điệu phổ của nhiễu ngẫu nhiên. Hiệu ứng này có thể nghe rõ khi nói thì thầm. Cấu tạo cơ bản của phụ âm trong mọi ngôn ngữ là âm vô thanh. Ngoài hai loại âm cơ bản ở trên, còn có một loại âm trung gian vừa mang tính chất nguyên âm, vừa mang tính chất phụ âm, được gọi là bán nguyên âm hay bán phụ âm. Ví dụ như âm ‘i’ và ‘u’ trong những từ ‘ai’, ‘âu’. - Âm bật hơi: Khi phát các âm này, bộ máy phát âm sẽ được đóng lại hoàn toàn tại một điểm nào đó trong bộ máy phát âm. Ap suất không khí trong bộ máy phát âm sẽ tăng lên tức thời và được giải phóng một cách đột ngột. Sự giải thoát nhanh chóng của áp suất này sẽ tạo nên một sự kích thích tạm thời của bộ máy phát âm. 4. Mô hình lọc nguồn tạo tiếng nói (Hình 2) minh họa mô hình rất đơn giản của bộ phận phát ra nguyên âm “e” là một ống đều có chiều dài L, một đầu nguồn âm thanh(dây thanh âm) và đầu kia được mở ra(môi). Ống này cộng hưởng ở các tần số lẻ f0, 3f0, 5f0… với f0=c/4L với c là vận tốc âm thanh trong không khí. Ví dụ, L=17cm, c=300m/s, thì sẽ cộng hưởng ở các tần số: 500Hz, 1500Hz, 2500Hz,… những đỉnh cộng hưởng này được gọi là các Formant. Bộ phận phát âm có thể nhiều dạng khác nhau và tạo ra những đỉnh cộng hưởng khác nhau hay các giá
  • 5. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 5 trị Formant khác nhau nên âm thanh phát ra khác nhau. Trong tiếng nói, các tần số Formant luôn thay đổi từ âm này sang âm khác. Hình 2: Mô hình ống đều của bộ phận phát âm Quá trình hình thành tiếng nói được biểu diễn bằng mô hình Source-filter: Hình 3: Tạo tiếng nói theo mô hình lọc nguồn Tín hiệu vào là tín hiệu từ nguồn âm thanh(cũng có thể là có chu kì hay nhiễu) được lọc bằng bộ lọc có tính chất cộng hưởng tương tự với bộ phận phát âm. Phổ của tín hiệu tiếng nói thu được bằng cách nhân phổ của bộ lọc với phổ của tín hiệu. AV, AN là các độ lợi biểu thị cường độ của âm thanh và cường độ nhiễu. Một bộ phận phát âm có một số hữu hạn Formant, nhưng chỉ cần quan tâm đến 3 hay 4 Formant đầu tiên trên băng tần từ 100Hz đến 3.5kHz do biên độ của các Formant cao hơn bị suy giảm gần như hoàn toàn với độ suy giảm -12dB/octave. Trường hợp tiếng nói vô thanh, phổ tương đối bằng phẳng, số lượng các Formant như vậy vẫn đủ mặc dù tiếng nói vô thanh có băng tần mở rộng lên đến 7-8kHz. Ngoài ra, do ảnh hưởng bức xạ của miệng nên biên độ được tăng lên chừng 6dB/octave trong băng tần 0-3kHz. Chình vì vậy mà đến phần tiền xử lý tín hiệu ta phải dùng bộ lọc tiền nhấn để bù thêm +6dB/octave.
  • 6. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 6 II. Cơ quan thính giác của con người: 1. Cấu tạo Hình 4: Cấu tạo cơ quan thính giác Tai ngoài: Bao gồm có vành tai và lỗ tai, chính lỗ tai sẽ dẫn tín hiệu âm thanh đến màng nhĩ và làm cho màng nhĩ rung lên. Độ lệch của màng nhĩ khoảng chừng vài nanomet và một tiếng nói thầm có thể tạo ra một độ lệch chỉ bằng một phần mười bán kính nguyên tử hydro. Tai giữa: Có một xương nhỏ gọi là xương búa áp sát vào màng nhĩ. Trong lúc màng nhĩ rung lên, vì xương búa liên kết với các xương khác, gọi là xương đe, làm xương này có thể quay. Trong lúc quay, xương đe lại liên kết với một xương khác, gọi là xương bàn đạp, nó áp sát vào cửa sổ hình ovan của vùng trong tai. Ba xương này (búa, đe, bàn đạp) là những xương nhỏ nhất trong cơ thể con người và được gọi chung là xương nhỏ. Chức năng của nó là truyền tải sự rung động của màng nhĩ đến cửa sổ hình oval ở trong tai. Tai trong: Cửa sổ hình oval là một màng phủ nhầy, mở rộng trong bức tường xương có cấu trúc xoắn ốc, được gọi là ốc tai. Chất lỏng trong ốc tai được chia theo chiều dài của nó thành hai màng nhầy, gọi là màng nhầy Reissner và màng nhầy cơ bản(màng đáy). Sự rung động của cửa sổ oval gây nên sóng áp suất truyền đến chất lỏng ở trong xương nhỏ và áp suất của sóng gây trên màng nhầy cơ bản một độ lệch tại những điểm khác nhau dọc theo chiều dài của nó. Áp chặt vào màng nhầy cơ bản là cơ quan vỏ não. Cơ quan này chứa khoảng 30000 tế bào hình sợi. Mỗi tế bào này có nhiều sợi nhỏ li ti nhô ra. Các sợi dây này uốn cong nhờ sự vận động của màng nhầy cơ bản và nhờ đó các tế bào hình sợi hoạt
  • 7. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 7 động. Các tế bào hình sợi này liên kết với các đầu cuối của nơron của hệ thần kinh để truyền tín hiệu về não. 2. Cơ chế nghe Khi ta nghe một sóng âm thuần tuý tức âm đơn (sóng sine), những điểm khác nhau trên màng đáy sẽ rung động thao tần số của âm đơn đi vào tai. Điểm lệch lớn nhất trên màng đáy phụ thuộc tần số âm đơn. Tần số càng cao tạo ra điểm lệch lớn nhất ở phía đáy và tần số thấp tạo ra điểm lệch lớn nhất phía đỉnh. Như vậy màng đáy đóng vai trò phân tích tần số tín hiệu vào phức tạp, bằng cách tách những tần số khác nhau ở những điểm khác nhau dọc theo chiều dài của nó. Mỗi điểm như vậy có thể xem là một bộ lọc thông dải có tần số trung tâm và băng thông xác định. Những đáp ứng này không đối xứng quanh tần số trung tâm, vùng tần số cao có tốc độ suy giảm dốc hơn nhiều so với vùng tần số thấp. Vị trí của độ lệch cực đại dọc theo màng nhày biến thiên phi tuyến theo tần số (theo hàm logarit). Những nghiên cứu chỉ ra rằng ngưỡng nghe của một âm đơn tăng lên khi có sự hiện diện của những âm đơn lân cận khác (âm mặt nạ) và chỉ có băng tần hẹp xung quanh âm đơn mới tham gia vào hiệu ứng mặ nạ, băng tần này thường gọi là băng tần tới hạn. Giá trị của băng tần tới hạn phụ thuộc vào tan số của âm đơn cần thử. Với âm đơn 100Hz, băng tần tới hạn xấp xỉ 90Hz, với âm đơn 5kHz là xấp xỉ 1kHz. Có thể xem quá trình nghe của hệ thính giác là một dãy cac bộ lọc băng thông, có đáp ứng phủ lấp lên nhau và băng thông hiệu quả của chúng xấp xỉ băng thông tới hạn. Đây là cơ sở cho việc thiết kế dãy băng lọc sau này III. Ngữ âm tiếng Việt 1. Âm vị Về mặt ngôn ngữ học, có thể xem tiếng nói là một chuỗi các âm cơ bản được gọi là âm vị. Âm vị là đơn vị ngôn ngữ trừu tượng và không thể quan sát trực tiếp trong tín hiệu tiếng nói. Nhiều âm vị khác nhau kết hợp với nhau một cách nào đó để tạo ra những âm thanh khác nhau. 2. Nguyên âm Nguyên âm được xác định bởi hốc cộng hưởng khoang miệng và hốc yết hầu-nguồn gốc của các Formant. Khoang miệng và khoang yết hầu được tách biệt ra bởi lưỡi. Do đó, sự thay đổi của khoang này đồng nghĩa với sự thay đổi của khoang kia. Việc xác định thể tích, hình dáng, lối thoát không khí của những hốc cộng hưởng này, tức xác định khả năng cộng hưởng của chúng, chính là mô tả độ mở của miệng, vị trí của lưỡi và hình dáng của môi.
  • 8. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 8 a. Phụ âm Đặc điểm cơ bản của phụ âm là sự cấu tạo bằng luồng không khí bị cản trở, sự cản trở này diễn ra với những mức độ khác nhau, cách thức khác nhau và ở những bộ phận khác nhau của cơ quan phát âm. Phụ âm đuợc chia ra phụ âm tắc (như ‘p’, ‘t’, ‘đ’, ‘b’) và phụ âm xát(như ‘v’, ‘s’, ‘x’)  Phụ âm tắc: Đặc trưng là một tiếng nổ, do luồng không khí bị cản trở hoàn toàn, phải phá vỡ sự cản trở để thoát ra ngoài. Phụ âm tắc được chia làm phụ âm bật hơi (như ‘th’)và phụ âm mũi (như ‘m’, ‘n’, ‘ng’, ‘nh’).  Phụ âm xát: Đặc trưng là tiếng cọ xát, phát sinh do luồng không khi đi ra bị cản trở không hoàn toàn(chỉ bị khó khăn) phải lách qua một khe hở nhỏ và trong khi thoát ra ngoài cọ xát vào thành của bộ phận phát âm. b.Thanh điệu Thanh điệu là sự nâng cao hay hạ thấp “giọng nói” trong một âm tiết. Âm tiết là đơn vị phát âm nhỏ nhất, trong tiếng Việt âm tiết là một từ. Thanh điệu là sự thay đổi cao độ của giọng nói, điều đó có nghĩa thay đổi biên độ tần số cơ bản trong âm hữu thanh. Thanh điệu được xác định bằng tần số cơ bản.
  • 9. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 9 PHẦN II: CÁC PHƯƠNG PHÁP TRÍCH CHỌN THAM SỐ ĐẶC TRƯNG CỦA TIẾNG NÓI Qua phần phân tích ngữ âm, ta thấy rằng, khi phát âm một từ (tổng quát gồm phụ âm, nguyên âm, thanh điệu), dây thanh âm rung tạo ra dạng sóng của luồng không khí, đến lượt bộ phận cấu âm và mũi biến đổi chậm làm thay đổi dạng sóng phát ra bên ngoài để tạo ra những từ khác nhau. Như vậy tín hiệu tiếng nói là do xung bước sóng chập với tín hiệu biến thiên chậm của bộ phận cấu âm. Điều này dẫn tới việc trích tham số tiếng nói rất hiệu quả là phân tích cepstral, trong phương pháp này người ta muốn lấy phần tín hiệu có tần số thấp do bộ phận cấu âm tạo ra. I. Phân tích cepstral theo thang đo mel Phương pháp tính các hệ số MFCC là phương pháp trích chọn tham số tiếng nói được sử dụng rộng rãi bởi tính hiệu quả của nó thông qua phân tích cepstral theo thang đo mel. Phương pháp được xây dựng dựa trên sự cảm nhận của tai người đối với các dải tần số khác nhau. Với các tần số thấp (dưới 1000 Hz), độ cảm nhận của tai người là tuyến tính. Đối với các tần số cao, độ biến thiên tuân theo hàm logarit. Các băng lọc tuyến tính ở tần số thấp và biến thiên theo hàm logarit ở tần số cao được sử dụng để trích chọn các đặc trưng âm học quan trọng của tiếng nói. Mô hình tính toán các hệ số MFCC được mô tả như (Hình 5). Hình 5: Sơ đồ tính toán các hệ số MFCC Ý nghĩa và phương pháp xác định tham số ở các khối trong sơ đồ trên mô tả như sau: Khối 1: Bộ lọc hiệu chỉnh (Preemphasis) Tín hiệu tiếng nói s(n) được đưa qua bộ lọc số bậc thấp để phổ đồng đều hơn, giảm ảnh hưởng gây ra cho các xử lý tín hiệu sau này. Thường bộ lọc này cố định bậc một, có dạng:
  • 10. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 10 H(z) = 1 – az-1 0.9 ≤ a ≤ 1.0 Quan hệ giữa tín hiệu ra với tín hiệu vào tuân theo phương trình ~ s (n) = s(n)-a.s(n-1) Giá trị a thường được chọn là 0.97. Khối 2: Phân khung (Frame Blocking) Trong khối này tín hiệu hiệu chỉnh được phân thành các khung, mỗi khung có N mẫu; hai khung kề lệch nhau M mẫu. Khung đầu tiên chứa N mẫu, khung thứ hai bắt đầu chậm hơn khung thứ nhất M mẫu và chồng lên khung thứ nhất N-M mẫu. Tương tự, khung thứ ba chậm hơn khung thứ nhất 2M mẫu (chậm hơn khung thứ hai M mẫu) và chờm lên khung thứ nhất N-2M mẫu. Quá trình này tiếp tục cho đến khi tất cả các mẫu tiếng nói cần phân tích thuộc về một hoặc nhiều khung. Khối 3: Lấy cửa sổ (Windowing) Bước tiếp theo là lấy cửa sổ cho mỗi khung riêng rẽ nhằm giảm sự gián đoạn của tín hiệu tiếng nói tại đầu và cuối mỗi khung. Nếu w(n), 0  n  N-1 Thông thường, của sổ Hamming được sử dụng. Cửa sổ này có dạng: Khối 4: Biến đổi Fourier rời rạc (FFT) Tác dụng của FFT là chuyển đổi mỗi khung với N mẫu từ miền thời gian sang miền tần số. FFT là thuật toán tính DFT nhanh. DFT được xác định Khối 5: Biến đổi sang thang đo Mel trên miền tần số Như đã nói ở trên, tai người không cảm nhận sự thay đổi tần số của tiếng nói tuyến tínhmà theo thang Mel. Người ta chọn tấn số 1kHz, 40 dB trên ngưỡng nghe là 1000 Mel. Do đó, công thức gần đúng biểu diễn quan hệ tần số ở thang mel và thang tuyến tính như sau:
  • 11. Tiểu luận môn học:Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 11 Hình 6: Các băng lọc tam giác theo tần số Mel Một phương pháp để chuyển đổi sang thang mel là sử dụng băng lọc (Hình 6), trong đó mỗi bộ lọc có đáp ứng tần số dạng tam giác. Số băng lọc sử dụng thường trên 20 băng. Thông thường, người ta chọn tần số từ 0 dến Fs/2 (Fs là tần số lấy mẫu tiếng nói). Nhưng cũng có thể một dải tần giới hạn từ LOFREQ đến HIFREQ sẽ được dùng để lọc đi các tần số không cần thiết cho xử lý. Chẳng hạn, trong xử lý tiếng nói qua đường điện thoại có thể lấy giới hạn dải tần từ LOFREQ=300 đến HIFREQ=3400. Sau khi tính FFT ta thu được phổ tín hiệu S(fn) . Thực chất đây là một dãy năng lượng W(m)=|s(fn)|2. Cho W(m) đi qua một dãy K băng lọc dạng tam giác, ta được một dãy các . Tính tổng của các dãy trong từng băng lọc, ta thu được một dãy các hệ số mk(k=1,2,3…,K). Khối 6: Biến đổi Cosine rời rạc (DCT)Trong bước này ta sẽ chuyển log của các giá trị mk về miền thời gian bằng cách biến đổi Cosine rời rạc (DCT). Kết quả của phép biến đổi này ta thu được các hệ số MFCC. Thông thường, chỉ có một số giá trị đầu tiên của ci được sử dụng. Trong các ứng dụng nhận dạng tiếng nói, người ta thường lấy 12 hệ số MFCC và thêm 1 hệ số năng lượng của khung sau khi đã được chuẩn hóa làm tham số đặc trưng cho tín hiệu tiếng nói (như vậy tổng cộng có Q=13 hệ số). Khối 7: Cepstral có trọng số Vì độ nhạy của các hệ số cepstral bậc thấp làm cho phổ toàn bộ bị đổ dốc, độ nhạy của các cepstral bậc cao gây ra nhiễu nên người ta thường sử dụng cửa sổ cepstral để cực tiểu hóa độ nhạy này. Công thức biểu diễn các hệ số cepstral có trọng số:
  • 12. Tiểu luận môn học: Truyền thông đa phương tiện NHD:TS. Nguyễn Hoàng Lan Học Viên: Nguyễn Ngọc Đăng 12 DOWNLOAD ĐỂ XEM ĐẦY ĐỦ NỘI DUNG MÃ TÀI LIỆU: 51555 DOWNLOAD: + Link tải: Xem bình luận Hoặc : + ZALO: 0932091562