KHO THƯ VIỆN 🔎

Bài giảng Xử lý tiếng nói: Phần 2

➤  Gửi thông báo lỗi    ⚠️ Báo cáo tài liệu vi phạm

Loại tài liệu:     PDF
Số trang:         63 Trang
Tài liệu:           ✅  ĐÃ ĐƯỢC PHÊ DUYỆT
 













Nội dung chi tiết: Bài giảng Xử lý tiếng nói: Phần 2

Bài giảng Xử lý tiếng nói: Phần 2

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 ÂN THÀNHHÀ NỘI - 2014CHI 'ƠNG 4. TÔNG HỢP TIÉNG NÓICHƯƠNG 4. TỎNG HỢP TIÊNG NÓI4.1.MỜ ĐẦUTrước đây khái niệm "tòng hợp tiếng nói" thường được dũng đế

chi quá trình tạo âm thanh tiếng nói một cách nhàn tạo tử máy dựa theo nguyên lý mỏ phòng cơ quan phát âm cùa người. Tuy nhiên ngày nay, cùng với sự p Bài giảng Xử lý tiếng nói: Phần 2

hát triển cúa khoa học công nghệ, khái niệm này đà được mờ rộng bao gồm cà quá trinh cung cấp các thông tin dạng tiếng nói lừ máy trong đó các bân tin

Bài giảng Xử lý tiếng nói: Phần 2

được tạo dựng một cách linh động đế phù hợp cho nhu cầu nào đó. Các ứng dụng của các hệ thống tống hợp tiếng nói ngày nay rất rộng rãi, từ việc cung

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 ÁP TỎNG HỢP TIÊNG NÓI4.2.1Tỗng hợp trực tiếpMột phương pháp đon gian thực hiện việc tống họp các ban tin là phương pháp lổng hợp trực tiếp trong đó cá

c phần cúa bán tin được chắp nối bời các phần (fragment) đơn vị cùa tiếng nói con người. Các đơn vị tiếng nói thường là các lừ hoặc các cụm từ được lư Bài giảng Xử lý tiếng nói: Phần 2

u trừ và bán tin tiếng nói mong muốn được tổng hợp bằng cách lựa chọn và chắp nối các đơn vị thích hợp. Có nhiều kỳ thuật trong việc tống hợp trực tiế

Bài giảng Xử lý tiếng nói: Phần 2

p tiếng nói và các kỳ thuật này được phân loại theo kích thước cùa các đon vị dũng đế chắp nối cũng như những loại biểu diền tín hiệu dũng để chắp nối

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 óng tín hiệu.4.2.1.1Phương pháp tồng hợp trực tiếp đơn giànPhương pháp đơn gián nhắt đê tạo các băn tin tiếng nói lã ghi và lưu trừ tiếng nói của con

người theo các đơn vị từ riêng lẽ khác nhau vã sau đó chọn phát lại các tứ theo thứ tự mong muốn nào đó. Phương pháp này được đưa vào sử dụng trong hệ Bài giảng Xử lý tiếng nói: Phần 2

thống điện thoại cùa nước Anh lừ những năm 36 cúa thế ký trước, từ những năm 60 cua thế kỳ trước thường được dùng trong một số hệ thống thòng báo côn

Bài giảng Xử lý tiếng nói: Phần 2

g cộng, và ngây nay vẫn còn có một ớ nhiều hệ thống quăn lý điện thoại trên thế giới. Hệ thống phài lưu trừ đầy đu các thành phần của các bân tin cẩn

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 dó mà không phai thay đối hay biến đổi các thành phần riêng rẽ.Chất lượng của bân tin tiếng nói được tổng hợp theo phương pháp này bị ánh hường bời c

hất lượng của tinh liên tục của các đặc trưng âm học (biên phổ, biên độ. tẩn sổ cơ băn, tốc độ nói) cúa các đơn vị được chẳp nối. Phương pháp tổng hợp Bài giảng Xử lý tiếng nói: Phần 2

này tõ ra hiệu qua91CHI ?ƠNG 4. TÒNG HỢP TIÊNG NÔIkhi các bán tin có dạng mộỉ danh sách chẳng hạn như một dãy số cơ bân, hoặc các khối bân tin thường

Bài giảng Xử lý tiếng nói: Phần 2

xuất hiện ờ một vị tri nhất định trong câu. Điều này dễ hiểu bới vì điều đó cho phép dề dàng đàm bão rằng bân tin được phát ra có tinh tự nhiên về mặ

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 ái được ghi lại đúng như thử tự của nó ờ trong câu nếu không nó sè không phù hợp với ngừ điệu cúa câu. Chăng hạn với các dày số cơ ban cũng cằn thiết

phái ghi lại chúng ớ hai dạng: một tương ứng với vị trí cuối càu và một dạng không. Điểu này là vi cấu trúc pitch cùa mồi đơn vị tiếng nói thay đồi tù Bài giảng Xử lý tiếng nói: Phần 2

y theo vị trí cùa từ trong câu. Như vậy. quá trình biên soạn là một quá trình rất tốn thời gian và công sức. Ngoài ra việc chắp nối trực tiếp các đơn

Bài giảng Xử lý tiếng nói: Phần 2

vị tiếng nói gặp rất nhiều khó khăn trong việc diễn tá sự ành hường tự nhiên giữa các từ, cùng như ngữ điệu và nhịp điệu cua câu. Một hạn chế nữa phài

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 ăng việc sứ dụng phương pháp mà hóa tốc độ thấp cho các đơn vị tiếng nói trước khi thực hiện việc lưu trữ. Tuy nhiên cà phương pháp sứ dụng lưu trử tr

ực tiếp hoặc mà hóa cua các đơn vị lớn (lừ, cụm tử) của tiếng nói. số lượng bân tin có thề tông hợp được rất hạn chế. Đê tàng số lượng bân tin có thể Bài giảng Xử lý tiếng nói: Phần 2

tồng hợp được, các đơn vị từ có thê được chia nhó hơn thành đơn vị từ con. diphone, demisyllable, syllable... được ghi và lưu trữ. Tuy nhiên khi đơn v

Bài giảng Xử lý tiếng nói: Phần 2

ị tiếng nói càng được chia nho thi chất lượng ban tin tông họp được chất lượng cảng bị giám.Hình 4.1 minh họa sự so sánh spectrogram của câu tống hợp

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 ù bân tin tống hợp trực tiếp và bàn tin nguyên thúy4.2.1.2Phương pháp tong họp trực tiếp từ các phân đoạn (lạng sóngNhư đà đề cập phần trên, phương ph

áp lổng hợp trực tiếp đơn giãn gặp phái hạn chế trong việc khỏi phục lốc độ và tính lự nhiên (nhấn, nhịp, ngừ điệu) cua bàn tin được lổng họp. Vấn đề Bài giảng Xử lý tiếng nói: Phần 2

nảy có thể được giài quyết bàng cách sứ dụng phương pháp tổng hợp lù các phân đoạn dạng sóng hay còn gọi là phương pháp tống hợp chồng vã thêm các đoạ

Bài giảng Xử lý tiếng nói: Phần 2

n sóng theo độ dài pitch. Xét bài toán nối hai phân đoạn của dạng sóng tin hiệu của nguyên âm. ta thấy ràng sự không liên tục trong dạng sóng lổng hợp

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 là vị tri tương ứng với vùng có biên độ tin hiệu nhô nhất khi đáp ứng tuyến âm với xung glottal hiện tại có sự suy giâm lớn và chi ngay trước một xun

g tiếp theo. Nói cách khác, hai phân đoạn tin hiệu được nối theo kiêu đồng bộ pitch (pitch-synchronous manner). Phương pháp phô biến thực hiện việc nà Bài giảng Xử lý tiếng nói: Phần 2

y là phương pháp TD-PSOLA (Time domain Pitch Synchronous Overlap Add).TD-PSOLA thực hiện việc đánh dấu các vị trí tương ứng với sự đóng lại của dây th

Bài giảng Xử lý tiếng nói: Phần 2

anh (tức là xung pitch) trong dạng sóng tin hiệu tiếng nói. Các vị tri đánh dấu này được sứ dụng dể tạo ra các phân đoạn cưa sổ của dạng sóng tín hiệu

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Bài giảng Xử lý tiếng nói: Phần 2 được chọn thích hợp. Ngoài ra. độ dài hàm cữa sô93CHI 4. TÒNG HỢP TIÊNG NÓIphâi dài hơn một chu kỳ nhăm tạo ra một sự chồng lấn nhô giữa các cưa sổ tí

n hiệu cạnh nhau. Bài giảng Xử lý tiếng nói: Phần 2

BỌ THÒNG TIN VÀ TRUYỀN THÔNGHỌC VIỆN CÒNG NGHỆ Bưu CHÍNH VIÊN THÒNG«*$**********«*«**********«*«**BÀI GIẢNGXỬ LÝ TIỂNG NÓIBIỀN SOẠN:PHẠM VÃN Sự LÉ XUÂ

Gọi ngay
Chat zalo
Facebook