Lê Thị Vĩnh Thanh, Nguyễn Thị Quỳnh Hương, Văn Thế Thành

Tóm tắt


Trong bài báo này, một mô hình tìm kiếm ảnh sử dụng cấu trúc RS-Tree và mạng học sâu Faster R-CNN được đề xuất nhằm nâng cao hiệu suất truy vấn ảnh. Trong mô hình này, các công việc sau được thực hiện: (1) cấu trúc RS-Tree được cải tiến thuật toán tách nút để nâng cao hiệu quả gom cụm các véc-tơ đặc trưng của tập ảnh đa đối tượng; (2) mạng học sâu Faster R-CNN được sử dụng để phát hiện và phân loại các đối tượng trên hình ảnh; (3) các hộp giới hạn chứa đối tượng trên ảnh được trích xuất đặc trưng cấp thấp và lưu trữ trên cấu trúc RS-Tree; Với mỗi ảnh đầu vào, hệ thống phát hiện và phân loại từng đối tượng bằng mạng học sâu Faster R-CNN; trích xuất véc-tơ đặc trưng cấp thấp; thực hiện truy vấn ảnh tương tự dựa trên cấu trúc RS-Tree. Thực nghiệm được thực hiện trên bộ ảnh đa đối tượng MS-COCO gồm 5000 ảnh với độ chính xác là 77.39%. Kết quả thực nghiệm được so sánh với các công trình khác trên cùng bộ ảnh nhằm đánh giá tính đúng đắn của mô hình đề xuất.


Từ khóa

clustering; image Retrieval; R-CNN; RS-Tree

Toàn văn:


Trích dẫn

