Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01C MÁY TÍNHHà Nội-2016Lời cam đoanrỏi xin cam (toan luận án này là kết quả nghiên cứu của tõi, được thực hiện dưới sự hường dẫn cùa PGS.TS. Lẽ Anh Cường và PGS.TS. Huỳnh Van Nam. Các nội dung trích dồn từ các nghiên cửu cùa các tác giả khác mà tôi trình bày trong luận án này dã được ghi rò nguồn tron Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01g phần tài liệu tham khảo.Lê Quang Hùnghttps://khothuvien.cori!Tóm tắtNhiệm vụ cùa một hộ thống dịch máy là tự động dịch một văn bàn từ ngôn ngữ này (Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
ví dụ, tiếng Anh) sang một vấn bản tương đương ở ngôn ngữ khác (ví dụ, tiếng Việt). Tính hữu ích của cõng nghệ dịch máy tíing lẽn cùng vói chất lượng ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01ác và (iii) thõng tin liên lạc, chang hạn như dịch email, chat. vv.Có một số cách tiếp cặn cho bài toán dịch máy như dịch trực tiếp (direct translation), dịch dựa trẽn chuyên đổi (transfer - based translation), dịch liên ngữ (intcrlingua translation), dịch dựa trên ví dụ (example - based translation Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01) và dịch thống kê (statistical translation). Hiện tại, dịch máy dựa trên cách tiếp cận thống kẽ dang là một hương phát triển dầy tiềm năng bôi nhữngLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
ưu diem vượt trội so với cốc cách tiếp cận khác. Thay vì xây dựng các từ điển, các quy luật chuyển đói bằng tay, dịch máy thống kê tự dộng xây dựng cáĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01ộ thuận vơi 8Ố lượng (kích thước) và chat lương cùa ngữ liệu song ngữ được sử dung để xây dựng hộ t hống dịch. Tuy nhiên, ngừ liệu song ngữ sản có hiện van còn hạn chế cả về kích thươc lan chất, lượng, ngay cả dối với các cộp ngôn ngữ chính. Ngoài ra, dối với các cặp ngôn ngữ có nhiều khác biệt vẻ c Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01ấu trúc ngữ pháp (ví dụ, Anh - Việt), vấn đề về chốt lượng dịch đang là thách thức dối vơi các nhà nghiên cứu về dịch máy trong nhiều năm qua. Vì vậy,Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
việc bỗ sung thêm ngữ liệu song ngữ và phát triễn các phương pháp hiệu quà hơn dựa trên ngữ liệu hiện có là những giải pháp quan trọng để tăng chắt lĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01gữ liệu song ngữ, cải tiến các phương pháp gióng hàng từ và xác định cụm từ song ngừ cho dịch máy thống kẽ, cụ the như sau:Thứ nhất, dối với bài toán xây dựng ngữ liệu song ngữ, chúng tòi khai thác từ hai nguồn: Web và sách diện tử song ngữ. Dối với nguồn tư Web, chúng tôi tập trung vào rút trích cá Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01c văn bán song ngừ từ các web-site song ngừ. Chúng tôi dề xuất hai phương pháp thiết kế các dạc trưng dựa trẽn nội dung: sứ dụng các từ bất biến giữaLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
hai ngôn ngữ (cognate) và sư dụng các phàn doạn dịch. Ngoài ra,chúng lồi kết hợp các dặc trưng (lựa (rên nội dưng vói các dặc trưng dựa trên cấu trúc ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01 dưa trẽn nội dung, sir dụng một số man lien kết giữa các khối văn bân trong hai ngôn ngư để rút trích các cân song ngư.Thứ hai. với bài toán gióng hàng tử, chúng tôi đồ xuất một số cải tiến đối vói mõ hình IBM 1 theo cách tiếp cạn dựa Iren ràng buộc, bao gồm: ràng buộc neo, ràng buộc vồ vị trí cưa Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01từ, ràng buộc về từ loại và ràng buộc về cụm từ. Vói mồi ràng buộc, chúng tôi dưa ra phương pháp tổng quát de rích hợp nó vào thuật toán cực dại kỳ vọLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
ng trong quá trình ước lượng tham số cùa mó hình. Ngoài ra, chúng tôi dưa ra một phương pháp đề két hợp các ràng buộc. Nhưng cài tiền này đã giúp nângĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01uất phương pháp rút trích cụm từ song ngữ từ ngư liệu song ngư, sư dụng các mẫu cú pháp kết hợp với gióng hàng cụm tư. Các cụm tư song ngư này dã dược ứng dụng vào viộc nâng cao chat lượng dịch cho hộ thống dịch máy thống kẽ Anh - Việt.Từ khóa: dịch máy. dịch máy thống kẽ. tri thưc song ngư. ngư liệ Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01u song ngư, vãn bân song ngữ. gióng hàng tư.iiiLời cảm ơnlYước hết, tôi xin gíri lời cảm ơn sân sác đốn PGS.TS. Lẽ Anh Cường và PGS. TS. Huỳnh Văn NamLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
, hai Thầy đã trực tiếp hướng dần. chi bào tận tình, luôn 11Ỏ trự và lạo những diều kiện lót nhất cho lõi học lạp và nghiên cứu.lồi xin gửi lời cám ơnĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01giáo ơ Bộ môn Khoa học máy tính, những người đã trực liếp giảng dạy và giúp dờ lõi trong quá trinh học tập và nghiên cứu ó trường.lồi xin gừi lời cảm ơn den các dòng nghiệp ờ Khoa Cõng nghẹ thõng tin, lYương Đại học Quy Nhơn, đặc biệt là TS. 'ĨYần Thiên Thành và TS. Lẽ Xuân Việt đã quan tâm, giúp đô Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01 và rạo điều kiện cho tôi trong thời gian làm nghiên cứu sinh.lồi xin gứi cảm ơn đến PGS.TS. Nguyễn Phương Thái, TS. Nguyễn Văn Vinh. TS. Phan Xuân HiLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
ền (Trường Đại hục Công nghệ, Đọi học Quốc gia Hà Nội). PGS.TS. Lô Thanh Hương (Trường Dại học Bách khoa Hà Nội), TS. Nguyễn Thị Minh Huyền. TS. Lê HồĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌC Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01ghẹ Việt Nam), các Thầy/Cô dã có những góp ý chinh sứa đe tòi hoàn thiện luận án.lõi xin gửi lời cam ơn đốn tất cã anh, chị. em và bạn đồng học ỏ Bộ môn Khoa học máy lính (Khoa Công nghệ thông tin. Trương Dại học Công nghẹ. Dại học Quốc gia Hà Nội), dặc biệt là chị Nguyen Thị Xuân Hương (Khoa Công n Luận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01ghệ thõng tin. Trường Dại học Dãn lập Hái Phòng), nghiên cứu sinh Hoàng Thị Diệp (Khoa Cõng nghệ thong liu, Trương Dại học Cong nghệ) dă giúp dơ tôi tLuận văn thạc sĩ khai phá tri thức song ngữ và ứng dụng trong dịch máy anh việt luận án ts công nghệ thông tin 62 48 01 01
rong thơi gian làm nghiên cứu sinh.Cuối cùng, tôi xin gửi lời càm ơn đến tất cà các thành viên trong gia đình rói. đạc biệt là vợ tôi - ngươi đã luôn ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌCĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC C ÔNG NGHẸLÊ QUANG HÌ NGKHAI PHÁ TRI THỨCSONG NGŨ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH - VIỆTLUẠN ÁN TIẾN Sì KHOA HỌCGọi ngay
Chat zalo
Facebook