Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản trong ảnh văn bảnLUẬN VĂN THẠC sĩ Ngành: Khoa học máy tínhHà Nội - 2021TRƯỜNG Đ/\I HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho hài toán phát hiện hảng và nhận dạng câu trúc của bảng trong ảnh văn bảnLUẬN VĂN THẠC sĩ Ngành: Khoa học máy tínhGiảng viên hướng dâ Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnn: TS. Nguyên Thị Ngọc ĐiệpHà Nôi - 2021Tóm tắtSố hóa dang là XII hưởng của thế giói. MỘI ví dụ rõ nhất the hiện cho XII hướng số hóa là việc sử dụngPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
các dinh dạng văn bân số như ảnh vãn bàn dang dẩn thay thế cho các định dạng văn bản vật lý nhờ sự tiện dụng và an toàn của chúng. Di kèm vái sự bùng TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnng tin lự dộng. Trên văn ban có nhiều dạng biêu diều thông tin mà bang là một trong nhừng dạng chứa nhiều thông tin và phô biến nhất. Trong bâng, các dừ liệu thường dược tố chức theo hàng cột rất dặc trưng. Vĩ vậy. để trích xuất thông tin trong bâng, bước đầu tiên cần xác định và tách được bang ra k Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnhói vãn ban. Đồng thời, bàng có cấu trúc rất đa dạng nên việc sứ dụng các thuật toán xứ lý ánh truyền thống dề phát hiện là rất khó khăn.Tận dụng sứcPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
mạnh của học sáu. trên thế giói đã có nhiều nghiên cứu ứng dụng các mô hình học sâu đê giái quyết bài toán phát hiện và nhận dạng cấu trúc báng trong TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnểu diễn dữ liệu trong bàng. Mặc dù dà có nhiều nghiên cứu liên quan nhưng các nghiên cứu dà công bố chưa lập trung vào dạng dữ liệu ảnh văn bân thu dược lừ việc chụp các văn bản vật lý bằng các thiết bị ghi hình. Trong thực thế. lượng dừ liệu ảnh chụp văn bân là rất lớn vì chụp ánh là một trong nhữn Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảng cách nhanh nhất đê số hóa vàn bán. Vì vậy. trong khóa luận này, tôi sẽ ứng dụng công nghệ học sâu đê giãi quyết bài toán phát hiện và nhận dạng cấuPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
trúc báng trên anh chụp vãn bán.Đế giâi quyết bài toán dặt ra. lỏi dà phát tricìi các phương pháp phát hiện và nhận dạng cầu trúc bâng dựa trên các mòTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnu xử lý đê làm phảng bâng. Mục đích của phương pháp lã tách được từng bâng ra khói ảnh văn bân ban đầu. Sau đó, các ảnh báng này dược đưa vào phương pháp nhận dạng cấu trúc bâng. Phương pháp nhận dạng cấu trúc sẽ sử dụng các mô hình học sâu dược huấn luyện de nhận dạng calltrúc của bâng thông qua vi Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnệc phát hiện các ô trong bâng. Đê huấn luyện các mô hình học sâu đề xuất, tôi đà xây dựng một phương pháp tự dộng tạo ảnh mô phóng ảnh chụp vãn bân doPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
các bộ dữ liệu sần có về ảnh chụp vân bân là rất ít. Phương pháp này sứ dụng các tính toán dế mô phong và thêm các hiệu ứng chi xuất hiện khi chụp văTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnệu bao gồm 22000 ánh mô phóng ánh chụp văn bân (dược gán nhàn vị trí bang) và 42028 ánh báng (dược gán nhàn vị trí các ô trong báng). Ngoài ra. dé đánh giá độ chính xác của các phương pháp phát hiện và nhận dạng cấu trúc bang, tôi dã gán nhãn thú công một bộ dừ liệu thực tế gốm 100 anh chụp văn bán Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnvà 100 ánh bâng. Két quã cuối cùng tỏi đạt được khá tốt và cao hơn các nghiên cứu liên quan dã công bố khi đánh giá trên bộ dừ liệu thực tế dã gán nhãPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
n. Cụ thê. phương pháp phát hiện báng của tôi cho kct qua loư diem anh lên đến 0.96 và chi số Fl là 0.83 (khi xét các bâng dự đoán có loư > 0.9 dược tTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảng cấu trúc bàng thông qua phát hiện các ô trong bảng, mô hình của tôi cho chi số F1 khi phát hiện các ô là 0.76.iihttps://khothu vien .comLời cảm ơnTòi xin câm ơn sâu sắc den TS. Nguyền Thị Ngọc Diệp dã liếp nhận, hướng dần. lận lình chi bâơ cùng nhũ dốc ihúc lôi hoàn thành nghiên cứu irong suối ihờ Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảni gian làm luận văn.Tôi xin gửi lỡi câm ơn đến các giảng viên dạy các lớp cao học của trường Dại học Công nghệ - Dại học Quốc gia I lã Nội đã truyền đPhát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản
ạt kiến thức cho tôi trong suối 2 năm tôi làm học viên cao học lại nường.Và cuối cùng, lôi xin gửi lòi cam ơn sâu sac nhất den bố mẹ - nhừng người dã TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảng Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bản TS. Nguyễn Thị Ngọc Diệp. Mọi (hông tin tham kháo được sử dụng trong luận văn đều được tôi trích dần dầy dú trong phần tài liệu tham kháo.Tôi xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình và xin chịu mọi hình thức kí luật theo quy định nếu sai phạm.iv Phát triển mô hình học sâu cho bài toán phát hiện bảng và nhận dạng cấu trúc của bảng trong ảnh văn bảnTRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘINguyễn Hoàng AnhPhát triển mô hình học sâu cho bài toán phát hiện hảng và nhận dạng cấu trúc của bảngGọi ngay
Chat zalo
Facebook