KHO THƯ VIỆN 🔎

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

➤  Gửi thông báo lỗi    ⚠️ Báo cáo tài liệu vi phạm

Loại tài liệu:     PDF
Số trang:         73 Trang
Tài liệu:           ✅  ĐÃ ĐƯỢC PHÊ DUYỆT
 













Nội dung chi tiết: Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi uyên ngành: Khoa học máy tínhLUẬN VĂN TĨTẠC sĩ KĨTOA nọc MÁY TÍNĨTMÒ ĐÀU1Lý (lo chọn đề tàiTrong nhưng năm gần đây. việc nghiên cửu và triển khai ứng

dụng công nghệ đa tác tử đã trở thành một trong những hướng trọng tâm của ngành Khoa học máy tính. Mặc dù công nghệ này chi mói băt đầu phát triền mạn Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

h từ năm 90 của thế ký XX nhưng nó đà thể hiện rất rò nét về tính hiệu qua và tầm ành hướng lích cực của nó trong ngành khoa học máy lính nói riêng và

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

các lĩnh vực có ứng dụng công nghệ thông tin nói chung. Đối với các lình vực lư động hóa công nghiệp, điểu khiến giam sát. phân phối năng lượng hay c

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi tác tử là một tất yếu. Mật khác chúng ta thấy rất rõ ràng máy tính hiện nay không còn là các hệ thống hoạt động riêng lẽ nửa. xu hướng điều khiển phàn

tán là một vẩn đề cốt lõi mà các nhà phát triển ứng dung cần quan lâm lới. Lượng công việc máy lính đàin nhiệm thay con người ngày càng nhiều, chúng Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

ta ngày càng trao quyền cho máy tính nhiều hơn. máy tính có thề quyết định nhùng tình huống quan trọng thay con người. Đế thực hiên lốt các công việc

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

thay con người, máy lính cần phai thông minh, linh hoạt trong môi trường hoạt động của mình. Trong vài năm gần đây. vấn đề máy học đã được nghiên cửu

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi Một trong những vấn đề thuộc lĩnh vực máy học là các giải pháp huấn luyện tác tử và đa tác lử. đây là vấn đề rất rộng và đẩy thách thức, các vấn đề m

ang tính lý thuyết cơ sờ không ngừng được bổ sung và hoàn thiện. Trước khi bước vào môi trường hoạt động thực sự của mình, tác tư cần phái trài qua mộ Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

t qua trình huấn luyện hay nói cách khác là học cách ra quyết định để có thế đem lại một kết quả tốt. Với mong muốn tìm hiểu về công nghệ tác tử. lác

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

tử thông minh, tương lác và phối hợp trong hệ đa tác từ đặc biệt là phương pháp huấn luyện cho hệ đa tác lử. chúng tôi đã quyết định chọn đề tài “Phươ

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi lác tử hành động trong môi trưởng cúa chúng, lẩy về chuồi các kết quã. các kết quả đó được phân tích, đánh giá vù cuối cùng là một bang lượng giá được

sinh ra từ nhùng kết quà trên. Bâng lượng giá mức độ quan trọng trong mồi hành động cứa tác tư chính là kết quà cứa quá trình huấn luyện vù nó chính Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

là căn cứ giúp (ác từ quyết định hành động của mình tại mỏi trạng thái trong mỏi trường hoạt động của nó. .Một trong những thuật toán huấn luyện tác t

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

ử được xem là nền móng cho nhiều nghiên cửu về sau đó là thuật toán huấn luyện đơn tác tử Q-Learning do Watkins vù Dayan xây dưng năm 1992 [18]. Có rấ

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi Wellman phát triền [I I). giâi thuật này dưa trên nền lang Q-Learning. lý (huyết cân bằng Nash vù lý thuyết trò chơi, với sự kết hợp trên giãi thuật n

ày đà cho phép huấn luyện với số lượng tác lử và không gian trạng thái tương đối lớn. Ỏ Việt Nam. tuy mới tiếp cận với công nghệ tác từ nhưng một số t Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

ác giã cũng đã cho ra những kết quả đáng ghi nhận có thề kể ra các tác giã như Từ Minh Phương với giãi thuật Q-Phân tán [ 19J1 Nguyễn Linh Giang vói g

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

iãi thuật Ọ- mờ cho hệ đa tác tử [10]. các kết quã của các tác giã đều đem lại những giá trị khoa học đáng kể và nền tâng của các kết qua đều được dưa

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi yện đa tác lử với sự có mặt cũa một tác tử theo dõi. Các ứng dụng cho thuật toán Ọ-Learning truyền thống thường ứng dụng cho đơn tác tử và trạng thái

đích cần đạt tới là cố định. Trong đề tài này. chúng lôi sè cố găng áp dụng Q-Learning cho hệ đa tác (ử với trạng thái đích liên tực (hay đòi.23Mục đí Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

ch và đỗi tuọiìg nghiên cứu3.1.Mục đích nghiên cứuThực hiện đề lùi này. mục đích đầu liên cùa luận văn là lồng hợp được các tài liệu về công nghệ lác

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

lử một cách đầy đủ. khái quát và có hệ thống. Mặt khác, ứng dụng được các thuật toán huấn luyện tác tử vào một số dạng bài toán khác nhau, cài đặt thử

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi ề đơn tác lử và hệ đa tác lừ. đối lượng nghiên cửu chính của đề tài đi sâu vào nghiên cứu về các vấn đề sau:1Tác tử thông minh và các loại kiến trúc c

ủa tác lữ thông minh2Tương tác giừa các tác lư trong cùng một hệ đa tác từ3Các tác từ phối hợp với nhau theo những quy tắc nào trong hệ đa tác tư4Thuậ Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

t toán Q-Learning và ứng dụng của nó.4Cấu trúc cùa luận vănNgoài phần mở đầu và kết luận, phần nội dung của luận văn gồm có 3 chương:Chương 1: Tồng qu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

an về tác tử và hệ đa tác tứChương 2: Phối hợp và tương tác trong hệ đa tác tưChương 3: Phương pháp huấn luyện đa tác lư với sự có mặt cùa tác lừ theo

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi c lư. các V kiến trái chiểu nhau nguyên nhân chu yếu xuất phát (ừ những yêu cầu khác nhau (rong một số ứng dung cụ thề. Nhừng mâu thuần này là điều xả

y ra rất nhiều trong ngành khoa học máy tính. Chính những ý kiến đa chiều đó của các nhà chuyên mòn đã cho thấy sự phong phú về khã năng ứng dụng cũng Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

như lý thuyết của công nghệ phần mềm hướng tác tử.Định nghĩa thường được sử dụng nhất phát biểu như sau: "Tác tứ (Agent) là hệ thống tính toán hoạt đ

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

ộng tứ chù trên một môi trường nào đó, có khà nâng còm nhộn và tác động vào môi trường” [6].Chúng ta quan tám đến một sổ các điểm quan trọng Situ của

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi với tác lư là phần mềm có thể là chương trình máy tính, các luồng thực hiệu (Thread), đối với tác lữ phần cứng thông thường lù các Robot, cúc thiết bị

giám sát giao thông. Phương pháp huấn luyện đa tác tử với sự có mặt của tác tử theo dõi

DẠI HỌC THÁI NGUYÊN TRƯỜNG DẠI HỌC CÔNG NGHỆ I HÔNG TIN & TRUYỀN THÔNGVŨ HẢI HIỆUPHƯƠNG PHÁP HUẤN LUYỆN ĐA TÁC TỬ VÓI sự CÓ MẶT CỦA TÁC TỦ THEO DÕIChu

Gọi ngay
Chat zalo
Facebook