(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
LÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI g bất kỳ công trinh nào khác.Tp. Hồ Chi Minh, ngày 20 thủng 8 năm 20ỉ 3(Ký tên và ghi rò họ tên)Huỳnh L«âm ĐồngiiLỜI CẤM ƠNEm xin chân thành câm om thầy Hoàng Trang dà tận tinh hướng dẫn em trong việc thực hiện luận vãn này. Ibây dã luôn giành sự quan tâm. thời gian và những chia sc gân gùi đê giúp (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI em hiêu và giai quyêt những khó khăn trong quá trình thực hiện dề tải nhận dạng tiếng nói. ỉ hay dă cung câp nhừng tài liệu cùng như định hướng dê cm(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
cỏ thê hoàn thành luận vãn sớm nhât có thẻ.Em cùng xin chân thành cam ơn khoa Diện Diện tư đậc biệt là bộ môn Điện từ dă tạo diêu kiện de em cỏ thè thLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI h gặp nhưng khỏ khăn và khúc mac chưa thề giãi quyết.Cuối cùng với tât cá tâm lòng con xin câm ơn gia dinh dà luôn quan tâm, chia sè và động viên đề con có thè hoàn thành chương trình học một cách tot nhất.iiiTÓM TẤT H ẠN VĂNTrong nhiều thập niên gần đây. việc điều khiển thòng qua nhận dạng tiêng nó (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI i tự động (ASR) nhận được sự quan tâm lớn thông qua nhiều ứng dụng. Có nhiều giãi thuật được đưa ra trong quá trình trích đặc trưng, huấn luyện củng n(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
hư nhận dạng. Thuật toán nhận dạng tiếng nói thông qua quá trinh trích đặc trưng các hệ số MFCC (Mel frequency cepstrum coefficient) và xây dưng CodebLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI ài trong nhiều ứng dụng. Trong luận văn này, tôi sè đánh giá thuật toán nêu trên thông qua việc xây dựng chương trinh nhúng trên KIT DSP, mà cu thê Là KIT DSKTMS320C6713 với nền tàng là bộ xừ lý TMS320C6000. Nội dung luận vãn được chia thành hai phần chính: phần đầu cua luận vãn sè trình bày nội dun (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI g về thuật toán trích đặc trưng MFCC và lượng lử vector trong nhận dạng tiếng nói Đồng thời, xây dựng phần mềm MATLAB mô phong các giai thuật đê có hì(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
nh dung khái quát về quá trinh nhận dạng. Phần thứ hai của luận văn sè xây dưng chương trinh nhúng trên KIT DSKTMS320C6713. Chương trình nhúng gồm có LÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI số hóa lóbil chuẩn bị cho quá trình huấn luyện và nhận dạng. Ngoài ra đè đây nhanh quá trinh tinh toán và đánh giá. dử liệu tiếng nói còn được lưu thành các file header trên CCS. KIT DSP sè Lấy dừ liệu trực tiếp từ các file này trong quá trinh tinh toán. Quá trình đánh giá có thè được thực hiện thô (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI ng qua việc thay đòi tạrc tiếp các thòng so trên các file dir liệu. Bộ xứ lý DSP C6713 với kiến trúc tập lệnh VLIW và khá năng xử lý dấu chấm động flo(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
ating-point; việc này đâm bão độ chính xác cao cho các phép tinh. Phạm vi giá trị các phép tính có thế mơ rộng trong phạm vi Single (32bit) hoặc doublLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI lượng từ vựng cần nhận dạng phụ thuộc vàoivdung luợng bộ nhớ. Bộ nhớ có thê được mờ rộng thông qua giao tiếp bộ nhớ mở rộng bên ngoài EM1F.Quá trinh huấn luyện sư dụng dừ liệu tiếng nói dược ghi âm tiực tiếp trẽn KIT hoặc lừ các file dừ liệu lưu san. Dừ liệu được xứ lý Inch đặc trưng MECC thành một (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI lập các hệ sô cho moi lù cân huân luyện. Thông qua giãi thuật lượng nr vector xây dựng codebook cho từ cần huấn luyện dựa trên các hệ sổ MFCC.Trong q(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
uá trình nhận dạng dừ liệu tiếng nói dược ghi àm trực tiếp trên Klì hoặc lù các file dù liệu lưu san. Dù liệu được xử lý inch đặc trưng MFCC thánh mộtLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI n trên. Khoảng cách Euclide nhó nhất sê xác dinh dược mầu tiếng nói cẩn nhận dạng. Đánh giá thuật toán nhận dạng dựa trên kết quá nhận dạng tập dìr liệu các từ số đếm từ một đến mười và và các từ “trái, phải, trên. dưới, trước, sau”. Mỏi lừ được đánh giá 100 lần. Thuật toán được đánh giá trên cơ sớ (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI điều chinh các thòng số của quá trinh huấn luyện và nhận dạng: kích thước cùa các frame âm thanh, khoang chồng lấn giừa các frame, kích thước codebook(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
.Đề tâng tính chính xác. khách quan của quá trinh đánh giá thi dử liệu trong ca phần huấn luyện và nhận dạng dươc Lấy mầu theo củng một phương pháp từLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI any applications . There are many algorithms given in the quote process characteristics . training and recognition . Speech recognition algorithm through characteristic coefficients extracted MFCC ( Mel frequency cepstrum coefficient ) and the construction of codebook by vector quantization methods (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI are based two methods for speech recognition algorithms and their other been widely used in many applications . In this essay , I will evaluate the ab(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
ove algorithms through building programs on embedded DSP KIT , KIT DSKTMS320C6713 in particular with a platform TMS320C6000 processor . The contents oLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI ation in speech recognition . At the same time . building simulation software MATLAB algorithms to visualize an overview of the identification process . The second part of the thesis will build on KIT DSKTMS320C6713 embedded programs . Embedded program consists of two parts : training and recognitio (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI n .In both sections . the voices were recorded and processed directly through IC AIC23S1 audio codec . 16bit digitized data prepared for the training(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
and recognition . In addition to accelerating the calculation and assessment, the voice data is stored in the file header on the CCS . KIT DSP will reLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI a file . C6713 DSP processor with VLIW instruction set architecture and the ability to handle floating point floating-point . this ensures high precision calculations . Scope value calculations can be extended within single ( 32-bit ) or double ( 64bit ) . The data in the calculation process include (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI s trained codebook and to recognize sound patterns that are stored on 16MB SDRAM memory . The number ofivrequired vocabulary recognition depends on th(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
e memory capacity . The memory can be expanded via memory' interface EMIF external expansion .Training process using voice data is recorded directly iLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI for vector quantization codebook built from need -based training MFCC coefficients .In the process of identifying the voice data is recorded directly on the KIT or from stored data files . Data processing extract MFCC features into a set of coefficients for each word to be recognized. Euclidean dist (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI ance is computed on the set of coefficients from the training set consists of codebook has stored in the previous section . Smallest Euclidean distanc(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI
e to determine the required sample voice recognition . Rating recognition algorithm based on the recognition results from the data set the count from LÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trong (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI . The algorithm is evaluated on the basis of adjusting the parameters of the training process and identity : the frame size of audio , some overlap between the frames . the codebook size .To increase the accuracy and objectivity of the assessment process . the data in both the training and recogniti (Luận văn thạc sĩ) Nhận dạng tiếng nói dùng giải thuật trích đặc trưng MFCC và lượng tử vector trên KIT DSKTMS320C6713 của TI on is sampled by the same method of recording . processing . calculation errors .ivLÒĨ CAM ĐOANTôi cam đoan đây là công Irinh nghiên cửu cúa tòi.Các số liệu, kết quà nêu trong luận văn là trung thực và chưa từng được ai công bố trongGọi ngay
Chat zalo
Facebook