(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01C MÁY TÍNHHà Nội-2016ĐẠI HỌC Qưỏc GIA HÀ NỌI TRƯƠNG DẠI HỌC CÔNG NGHẸLÊ Ọl ANG HÙNGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTChuyên ngành: Khoa học máy tính Mà số: 62 48 01 01LUẬN ÁN TIÉN Sỉ KHOA HỌC MÁY TÍNHNGƯỜI HƯỚNG DẴN KHOA HỌC:1.PGS.TS. Lê Anh Cường2.PGS.TS. Huỳnh Văn NamH (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01à Nội-2016Lời cam đoan'lồi xin cam đoan lnận án này là kết quà nghiên cửu ciìa rỏi, được thực hiện dưđi sự hướng dần cna PGS.TS. I/Õ Anh Cường và PGS.(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
TS. Huỳnh Van Nam. Các nội dung trích dẵn từ các nghiên cứu cùa các Lác giã khác mà tõi trình bày trong luận Án này đã được ghi rõ nguồn trong phàn tàĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01ếng Anh) sang một vãn bản tương dương ở ngôn ngữ khác (ví dụ, tiếng Việt). Tính hữu ích của cõng nghệ dịch máy tàng lẽn cùng với chất lượng cua nó. Dịch máy có nhiều ứng dụng như: (i) dịch tài liệu tiếng mtớc ngoài cho mục đích hiểu nội dung, (ii) dịch vốn bàn để xuất bân ở các ngôn ngữ khác và (iii (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01) thõng tin liên lạc, chẳng hạn như dịch email, chat, vv.Có một số cách tiếp cận cho bài toán dịch máy như dịch trực tiếp (direct translation), dịch d(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
ựa trẽn chuyên dổi (transfer - based translation), dịch liên ngữ (intcrlingna translation), dịch dựa trôn ví dụ (example - based translation) và dịch ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01vượt trội so với các cách tiếp cặn khác. Thay vì xây dựng các từ điển, các quy luật chuyển đói bằng tay, dịch máy thống kê tự dộng xây dựng các tư điển, các quy luật di.ta trên kết quà thống kẽ có được từ ngữ liệu. Dối vơi một hệ thống dịch máy thống kẽ, hiệu quả (chắt lượng dịch) của nó tỷ lộ thuận (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01 vơi số lượng (kích thước) và chat lương cùa ngữ liệu song ngữ dược sử dụng dế xây dựng hộ t hống dịch. Tuy nhiên, ngừ liệu song ngữ san có hiện van c(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
òn hạn chế cà về kích thươc lan chất, lượng, ngay cả đối với các cặp ngôn ngữ chính. Ngoài ra, dối với các cặp ngôn ngữ có nhiều khốc biệt về cấu trúcĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01ổ sung thêm ngữ liệu song ngữ và phát triễn các phương pháp hiệu quà hơn dựa trên ngữ liệu hiện có là những giải pháp quan trọng để tăng chắt lượng dịch cho dịch máy thống kẽ.Luận ân cùa chúng tôi tập trung giải quyết các tồn tại dã nêu thông qua ba bài toán: phát triến phương pháp xây dựng ngữ liệu (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01 song ngữ, cải tiến các phương pháp gióng hàng từ và xác định cụm từ song ngừ cho dịch máy thống kẽ, cụ the như sau:Thứ nhắt, dối với bài toán xây dựn(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
g ngừ liệu song ngữ, chúng tôi khai th.ác từ hai nguồn: Web và sách diện tử song ngữ. Dối với nguồn tư Web, chúng tôi tập trung vào rút trích các vãn ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01ôn ngữ (cognate) và sư dụng các phàn đoạn dịch. Ngoài ra,chúng lồi kết hợp các dặc trưng (lựa (rên nội dưng vói các dặc trưng dựa trên cấu trúc của trang tne.b để rút trích các van bán song ngữ, bàng cách sứ dụng phương pháp học máy. Dối với nguồn tư sách diện tư. chúng tôi dẻ xuất phương pháp dưa t (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01rẽn nội dung, sir dụng một số man lien kết giữa các khối văn bân trong hai ngôn ngư để rút trích các cân song ngư.Thứ hai. với bài toán gióng hàng tử,(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
chúng tôi đồ xuất một số cải tiến đối vói mõ hình IBM 1 theo cách tiếp cạn dựa Iren ràng buộc, bao gồm: ràng buộc neo, ràng buộc vồ vị trí cưa từ, ràĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01ng quá trình ước lượng tham số cùa mó hình. Ngoài ra, chúng tôi dưa ra một phương pháp đề két hợp các ràng buộc. Nhưng cài tiền này đã giúp nâng cao chất lượng dịch cho hệ thống dịch máy thống kẽ Anh - Việt.Thứ ba, đối với bài toán xác định cụm từ song ngư cho dịch máy thống kẽ, chúng tỏi dề xuất ph (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01ương pháp rút trích cụm từ song ngữ từ ngư liệu song ngư, sư dụng các mẫu cú pháp kết hợp với gióng hàng cụm tư. Các cụm tư song ngư này dã dược ứng d(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
ụng vào viộc nâng cao chat lượng dịch cho hộ thống dịch máy thống kẽ Anh - Việt.Từ khóa: dịch máy. dịch máy thống kẽ. tri thưc song ngư. ngư liệu songĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01Thầy đã trực tiếp hướng dần. chi bào tận tình, luôn 11Ỏ trự và lạo những diều kiện lót nhất cho lõi học lạp và nghiên cứu.lồi xin gửi lời cám ơn đến các Thằy/Cõ giáo ơ Khoa Cõng nghệ thông tin, lYường Đại học Cõng nghệ. Đại học Quốc gia Hà Nội. đạc biệt là. PGS.TS. Phạm Bao Sơn và các Thầy/Cõ giáo ơ (LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01 Bộ môn Khoa học máy tính, những người đã trực liếp giảng dạy và giúp dờ lõi trong quá trinh học tập và nghiên cứu ó trường.lồi xin gừi lời cảm ơn den(LUẬN văn THẠC sĩ) khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án TS công nghệ thông tin 62 48 01 01
các dòng nghiệp ờ Khoa Cõng nghẹ thõng tin, lYương Đại học Quy Nhơn, đặc biệt là TS. 'ĨYần Thiên Thành và TS. Lẽ Xuân Việt đã quan tâm, giúp đô và rạĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌCĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌCGọi ngay
Chat zalo
Facebook