Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt VIẸTLUẬN VĂN THẠC sĩ KỸ THUẬT VIỀN THÔNGTHÁI NGUYÊN 2019DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VẤN NGHĨ ANGHIÊN cúư ÁP DỤNG MÔ HÌNH MẠNG NO-RON END-TO-END CHO NHẠN DẠNG TIÊNG NÓI TIẾNG VIFTChuyên ngành: Kỹ thuật viễn thông Mã số: 8520208LUẬN VĂN THẠC sỉ KỲ THUẬT VIỀN THÔNGKHOA Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt CHUYÊN MÔN NGƯỜI III ÓNG DẤN KHOA HỌC TRƯỞNG KHOATS. NGUYỀN VÁN HUYPHÒNG DÀO TẠOTHÁI NGUYÊN 2019Lòi nói đầuNhận dạng tiếng nói là mong ước cứa khoa họNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
c và con người. Những người máy có thê hiểu được tiếng người nói và thực thi nhiệm vụ theo mệnh lệnh người nói.Các kỳ thuật nhận dạng tiếng nói đà và DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt nhận dạng tiếng nói như: Người nói, tốc độ nói, hoàn canh nói, nhiều, kích thước từ điên, cách thức phát âm,... tuy nhiên hiện nay vần chưa có một giãi pháp nào hoàn thiện giãi quyết tất cà các yếu tố đó. Các phương pháp cơ ban thường được sứ dụng cho nhận dạng tiêng nói là: Kỳ thuật so khớp mẫu. mạ Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt ng nơ-ron, phương pháp dựa trên tri thức và mô hình Markov ân. Trong đó phương pháp sư dụng mò hĩnh Markov ân (Hidden Markov Model HMM) được sử dụng pNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
hô biên nhất.Đối với tiêng Việt hiện nay vần chưa thực sự được nghiên cứu rộng rãi vê nhận dạng. Các công việc nghiên cứu mới đang ờ nhùng bài toán cơDẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt (Anh, pháp,...), nhận dạng tiếng Việt còn phai nghiên cứu van đề nhận dạng thanh điệu. Tiếng Việt có sáu thanh điệu, một cách tỏng quát có thê coi như mồi âm tiết sè có thê có sáu ỷ nghía khác nhau khi ghép tương ứng với sáu thanh diệu đó. Việc nhận dạng thanh điệu là một công việc khó do thanh điệ Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt u chi tồn tại ờ vùng âm hữu thanh. Vi the đường đặc tính cùa nó không liên tục khi chuyên tiếp giừa hai vùng hừu thanh và vô thanh. Các đặc trưng đượcNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
sử dụng phô biến trong nhận dạng tiêng nói như MFCC (Mel Frequency Cepstral Coefficient) và PLP (Perceptual Linear Prediction) lại không mỏ tã được cDẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt g nói.Khi áp dụng mô hình mạng nơ-ron (Deep Neural Network - DNN) cho nhận dạng tiếng Việt, cụ thê là trong quá trinh trích chọn đặc trưng BottleNeck, đà giúp cãi thiện chat lượng hệ thống nhận dạng. Tuy nhiên, neu sừ dụng môhình mạng nơ-ron truyền thông, các mô hình DNN này được huân luyện trên tập Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt dừ liệu đà được gán nhàn, sẽ can tốn nhiêu thời gian cho việc huấn luyện, và chất lượng mò hình huấn luyện phụ thuộc vào thu tục liên kết các mô hìnhNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
trong nó. Do mô hình truyền thong gom ba phan chính: là mô hình phát âm (pronunciation model - PM), mô hình ngừ âm (acoustic model - AM) và mô hình nDẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt và LM trong mò hình mạng nơ-ron truyền thong, vảo một mô hình đơn nhát là can thiết, và việc huấn luyện có thè thực hiện trực tiếp trên tập dừ liệu chưa được gán nhàn. Nghĩa là việc huân luyện chi yêu cầu các file tiếng nói (audio tile) và phiên âm cùa chúng - đây chinh là mô hình End-to-End (E2E).X Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt uất phát từ nhận thức trên, được sự gợi hướng cùa Thầy giáo, TS. Nguyễn Vãn Huy, học viên xin trình bày luận vãn tổt nghiệp Thạc sỳ chuyên ngành Kỳ thNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
uật Viễn thông về “Nghiên cứu áp dụng lììô hình mạng nơ-ron End-to-End cho nhận dạng tiếng nói tiếng Việt'*.Nội dung chính của luận văn được trình bàyDẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt ng lĩnh vực nhận dạng tiếng nói. Giới thiệu tông quan về tinh hình nghiên cứu nhận dạng tiêng Việt trong và ngoài nước. Giới thiệu các nội dung nghiên cứu chinh cùa luận văn.❖Chương 2: Mô hình mạng nơ-ron học sâu End-to-End cho nhận dạng liểng nói. Giới thiệu về các thành phan cơ bán trong hệ thong Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt nhận dạng tiếng nói từ vựng lớn. Mô hĩnh dựa trên mạng nơ-ron học sâu (Deep Neural Network - DNN) cho nhận dạng tiếng nói. Phân loại mô hình mạng DNNNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
truyền thống, mạng DNN End-to-End: và ứng dụng trong nhận dạng tiếng nói ngôn ngữ không phải tiếng Việt.iỉ❖ Chương 3: Áp dụng mò hình mạng nơ-ron End-DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt te.Tôi xin được giri lời cam ơn đặc biệt den TS. Nguyền Văn Huy, dâ luôn chi báo. định hướng, tạo điệu kiện thuận lợi nhắt đê tói có thê hoàn thành luận văn này.Thái Nguyên, ngày tháng năm 2019Trần Văn NghĩaiiiLòi cam đoanTỏi xin cam đoan đây lã công trinh nghiên cứu của riêng tôi và được sự hướng Nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt dẫn khoa học cúa TS. Nguyễn Văn Huy. Các nội dung nghiên cứu, kết quà trong đe tài này là trung thực và có nguồn gốc rõ ràng. Những so liệu trong cácNghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt
bàng biêu phục vụ cho việc phân tích, nhận xét, đánh giá được thu thập từ các thử nghiệm thực te.DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNG DẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KÝ THUẬT CÔNG NGHIỆPTRÀN VĂN NGHĨANGHIẾN CỨU ÁP DỤNG MÔ HÌNH MẠNG Nơ-RON END-TO-ENl) CHO NHẠN DẠNG TIÊNG NÓI TIÊNGGọi ngay
Chat zalo
Facebook