NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
DẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP C sỉ Ngành: Khoa học máy tínhHÀ NỘI - 2021DẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÔNG NGHỆNguyễn Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VĂN THẠC sĩ Ngành: Khoa học máy tínhCán bộ hướng dần: TS. Nguyền Thị Ngọc DiệpHÀ NỘI - 2021TÓM TẮTChuyên (lõi số và NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP số hóa văn bàn (lã (lem lại những lợi ích vô cùng lo lớn cho các doanh nghiệp là cắt giảm chi phí vận hành, và tăng hiệu quả làm việc, các quyết địnhNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
bậy giờ được đưa ra nhanh chóng và chính xác hơn nhờ các hộ thống báo cáo thõng snot kịp thơi. Doi lại, số lượng các văn bàn báo C4ÍO càn phải giãi quDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP mà còn cần tìm kiếm cấc (loi tượng (lo họa như bâng bion, (ló thị. Các hệ thống lìm kiếm (ló họa ninon hoạt (lộng hiệu quả thì cần có bước nhận dạng và phát hiện các đối tượng này. Da phần các phương pháp và mõ hình nhận diện dối tượng (lồ họa trong anh văn bàn hiện nay dang dược huấn luyện trẽn một NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP bộ dữ liệu có dù hai phần là vị trí và ten nhãn của (lói tượng (lò họa. (.’óng sức và thời gian (lể gán nhãn cho các bộ dữ liệu này là rốt lơn. Đo vậNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
y trong luận văn này chúng tôi dề xuất một phương pháp có the tận dụng bộ dữ liệu không dầy du về tên nhãn cùa các lớp de nhận dụng các dối tượng dồ hDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP liệu chỉ bao gồm các vị trí của hộp giới hạn.Dề xuất phương pháp sit dụng mạng học sâu tự giám sát. D1NO cho bước trích xuất thuộc tính hình ảnh dùng trong bài toán phân loại các lớp dối tượng đồ họa vơi bộ (lữ liệu có số lượng ảnh mói lơp hạn che.- Xây dựng và phát triển hẹ thống lìm kiêm và truy NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP xuất các dối tượng dồ họa trong ảnh vân bản.Phương pháp nhạn dạng các dói tượng dồ họa trong anh vãn bàn dược trinh bày trong luận van dã dược thừ nghNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
iệm và đạt két quá xấp xĩ 71% trên các bộ dữ liệu kiểm thử và (lánh giá. Ap dụng các phương pháp Iren vào (le xãy dựng nen hẹ thống lìm kiêm và truy xDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP STRACTDigital t ransformation and digit ization of documents have great ly benefited businesses as they can cut. operating costs and increase working efficiency. Decisions are now made quickly and accurately through timely and transparent reporting systems. Ill turn, the number of report documents t NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP hat need to be processed and stored increases, loading to an increasingly complex search problem. The need now is not just to search from the text ualNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
content but also to look for graphic objects such as tables and graphs. For visual search systems to work effectively, there is a need to recognize aDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP h two parts, the location and the label name of the graphical object, rhe effort, to label these datasets is not tiny, and the time spent is also considerable. Therefore, in this thesis, wo propose a method that can use the incomplete data set of label names of classes to identify graphic objects. T NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP he main contribut ions of t he thesis include.We propose using a convolutional neural network (YOLO) to locate graphic objects with a dataset that incNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
ludes only the bounding box’s locations.We propose a method to use a setf-supervised deep learning network (DINO) for the feature extract ion step useDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP raphic objects in text images.The method of recognizing graphic objects in text images presented in this t hesis has been tested and achieved approximately 74% results on tost and evaluation datasets. Applying the above mot hods to build a system for searching and retrieving documents from graphic o NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP bjects also achieved the top 3 recall results of 93.3%.Keywords: object recognition, image classification, graphic object2LỜI CẢM ƠNLời dầu tiên cho tNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
ôi xin (lược gửi lời cảm ơn chân thành và sân sắc nhất tới TS. Nguyen Thị Ngọc Diệp người đã hướng dần và chi bảo tận tình nhắt cho tôi trong suốt quáDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠC NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP những ngươi dã tạo diều kiện lót nhất de tôi có the học tập, nghiên cữu và hơn cá là dã truyền thụ cho tôi những hành trang kiên thức dầy (hì nhất.lôi cũng xin gửi lời cám ơn chân thành nhắt tới những ngươi bạn người anh. chị dã giúp dơ tói hoàn thiện cả về kiến thức chuyên mơn và kỹ năng học tập n NHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP ghiên cứu.Cuối cùng và không the thiếu dó lã lời cảm ơn lơi bố mẹ và chị tôi vã dặc biệt là bạn Dung Phùng những ngươi dã luôn bẽn cạnh tõi giúp dơ vàNHẬN DẠNG đối TƯỢNG đồ họa TRONG ẢNH văn bản sử DỤNG MẠNG nơ RON TÍCH CHẬP
dộng viên cổ vù tinh thần tơi trong những lúc khó khàn nhất.lồi xin chân thành cam ơn!ỉlà Nội, ngày 10 tháng 10 năm 2021DẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠCDẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG DẠI HỌC CÕNG NGHỆNguyền Tuấn AnhNHẬN DẠNG Dối TƯỢNG Dồ HỌA TRONG ẢNH VĂN BẢN SỬ DỤNG MẠNG NƠ RON TÍCH CHẬPLUẬN VÃN THẠCGọi ngay
Chat zalo
Facebook