Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt VIETLUẬN VÁN THẠC sĩ KỲ THUẬT VIỀN THÔNGTHÁI NGUYÊN 2019ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VÃN NGHĨ ANGHIÊN cũu ÁP DỤNG MÔ HÌNH MẠNG NO RON END 10-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG MẸTChuyên ngành: Kỹ thuật viễn thông Mã số: 8520208LOAN VĂN THẠC si KỸ THUẬT VIỂN THÔNGKHOA CH Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt UYÊN MÔN NGƯÒÌ HƯỚNG DẢN KHOA HỌC TRƯỞNG KHOATS. NGI YỀN VĂN III YPHÒNG ĐÀO TẠOTHÁI NGUYÊN 2019Lời nói đầuNhận dạng tiêng nói là mong ước của khoa họcNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
và con người. Nhừng người máy có thê hièu được tiếng người nói vả thực thi nhiệm vụ theo mệnh lệnh người nói.Các kỳ thuật nhận dạng tiếng nói đà và đDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt hận dạng tiếng nói như: Người nói, tốc độ nói, hoàn cánh nói, nhiều, kích thước từ diên, cách thức phát âm,... tuy nhiên hiện nay vần chưa có một giai pháp nào hoàn thiện giãi quyết tất cà các yếu to đó. Các phương pháp cơ ban thường dược sừ dụng cho nhận dạng tiếng nói là: Kỳ thuật so khớp mẫu. mạn Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt g nơ-ron. phương pháp dựa trên tri thức và mô hình Markov ẩn. Trong đó phương pháp sư dụng mô hình Markov ân (Hidden Markov Model HMM) được sir dụng pNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
hô bien nhất.Đối với tiêng Việt hiện nay vần chưa thực sự dược nghiên cứu rộng rài về nhận dạng. Các công việc nghiên cứu mới đang ở nhưng bài toán cơDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt (Anh. pháp,...), nhận dạng tiếng Việt còn phai nghiên cứu van đe nhận dạng thanh điệu. Tiếng Việt có sáu thanh điệu, một cách tông quát có thê coi như mỗi âm tiết sè có thê có sáu ý nghía khác nhau khi ghép tương ứng với sáu thanh điệu đó. Việc nhận dạng thanh điệu là một công việc khó do thanh điệ Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt u chĩ tồn tại ờ vùng âm hừu thanh. Vi the đường dặc tinh của nó không liên tục khi chuyên tiếp giừa hai vùng hừu thanh và vô thanh. Các đặc trưng đượcNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
sử dụng phó biến trong nhận dạng tiêng nói như MFCC (Mel Frequency Cepstral Coefficient) và PLP (Perceptual Linear Prediction) lại không mô tã được cDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt g nói.Khi áp dụng mô hình mạng nơ-ron (Deep Neural Network - DNN) cho nhận dạng tiếng Việt, cụ thè là trong quá trinh trích chọn đặc trưng BottleNeck. đà giúp cãi thiện chat lượng hệ thong nhận dạng. Tuy nhiên, neu sữ dụng mỏhình mạng nơ-ron truyền thòng, các mó hình DNN này được huân luyện trên tập Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt dừ liệu đà được gán nhàn, sè can ton nhiêu thời gian cho việc huân luyện, và chat lượng mô hình huấn luyện phụ thuộc vào thu tục liên kết các mô hìnhNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
trong nó. Do mô hình truyền thong gom ba phần chính: là mô hình phát âm (pronunciation model - PM). mô hình ngừ âm (acoustic model - AM) và mò hình nDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt và LM trong mỏ hình mạng nơ-ron truyền thong, vào một mô hình đơn nhát là cần thiết, và việc huấn luyện có thê thực hiện trực tiếp trên tập dừ liệu chưa được gán nhàn. Nghĩa lã việc huấn luyện chi yêu càu các file tiếng nói (audio file) và phiên âm cùa chúng - đây chinh là mò hình End-to-End (E2E).X Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt uất phát từ nhận thức trên, được sự gợi hướng cùa Thầy giáo. TS. Nguyễn Văn Huy, học viên xin trinh bày luận vãn tốt nghiệp Thạc sỳ chuyên ngành Kỳ thNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
uật Viễn thòng về “Nghiên cứu áp dụng mô hình mạng nơ-ron End-to-End cho nhận dạng tiếng nói tiếng Việt*'. • • •Nội dung chinh của luận văn được trìnhDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt trong lĩnh vực nhận dạng tiếng nói. Giới thiệu tông quan về tinh hình nghiên cửu nhận dạng tiêng Việt trong và ngoài nước. Giới thiệu các nội dung nghiên cứu chinh của luận văn.❖Chương 2: Mô hình mạng nơ-ron học sâu End-to-End cho nhận dạng tiếng nói. Giới thiệu về các thành phan cơ bán trong hệ th Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt ong nhận dạng tiêng nói từ vựng lớn. Mô hình dựa trên mạng nơ-ron học sâu (Deep Neural Network - DNN) cho nhận dạng tiếng nói. Phàn loại mô hình mạngNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
DNN truyền thong, mạng DNN End-to-End: và ứng dụng trong nhận dạng tiêng nói ngôn ngừ không phài tiếng Việt.ii❖ Chương 3: Áp dụng mò hình mạng nơ-ron DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG V Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt thực te.Tôi xin được giri lời cam ơn đặc biệt den TS. Nguyền Văn Huy, dâ luôn chi báo. định hướng, tạo điệu kiện thuận lợi nhắt đê tói có thê hoàn thành luận văn này.Thái Nguyên, ngày thủng nam 2019Trần Văn NghĩaiiiLòi cam đoanTỏi xin cam đoan đây lã công trinh nghiên cứu của riêng tôi và được sự hư Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt ớng dẫn khoa học cúa TS. Nguyễn Văn Huy. Các nội dung nghiên cứu, kết quà trong đe tài này là trung thực và có nguồn gốc rõ ràng. Nhùng so liệu trongNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
các bàng biêu phục \-ụ cho việc phân tích, nhận xét, đánh giá được thu thập từ các thử nghiệm thực te.DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG VDẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC KỲ THUẶT CÔNG NGHIỆPTRẤN VÃN NGHĨANGHIẾN cửu ÁP DỤNG MÔ HÌNH MẠNG NƠ-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓT TIÊNG VGọi ngay
Chat zalo
Facebook