Thứ Sáu, 28 tháng 2, 2014
NGHIÊN CỨU PHƯƠNG PHÁP KẾT HỢP CÁC ĐẶC TRƯNG MÀU SẮC HÌNH DẠNG VÀ VỊ TRÍ ĐỂ TRUY VẤN ẢNH
2
1.4.2 Truy vấn ảnh sử dụng chỉ mục màu sắc, hình dạng và vị trí 24
1.4.3 Truy vấn ảnh dựa trên mạng Nơron 27
Chương 2: ĐỀ XUẤT HỆ THỐNG LIÊN MẠNG META-NƠRON 34
2.1 Mạng Nơron 34
2.2 Hệ thống liên mạng meta-Nơron 36
2.2.1 Giới thiệu các phương pháp kết hợp 36
2.2.2 Kiến trúc của hệ thống liên mạng meta-Nơron 43
2.2.3 Quá trình huấn luyện của hệ thống liên mạng 48
2.2.4 Quá trình đánh giá một mẫu X qua hệ thống liên mạng 52
2.3 Hệ thống liên mạng meta-Nơron cho bài toán truy vấn ảnh 53
Chương 3: MỘT ÁP DỤNG CỦA HỆ THỐNG LIÊN MẠNG
META-NƠRON 58
3.1 Rút trích các đặc trưng của ảnh 58
3.2 Kiến trúc hệ thống liên mạng meta-Nơron 61
3.3 Xây dựng hệ thống liên mạng meta-Nơron 62
Chương 4: CHƯƠNG TRÌNH ỨNG DỤNG 70
4.1 Quá trình xử lý ảnh trước khi đưa vào hệ thống liên mạng 70
4.2 Rút trích các đặc trưng và lưu vào cơ sở dữ liệu 73
4.3 Tìm cấu hình mạng tối ưu 74
3
4.4 Thực hiện truy vấn tìm vùng du lịch 77
Chương 5: KẾT LUẬN 79
TÀI LIỆU THAM KHẢO 82
PHỤ LỤC A: Mạng Nơron Lan Truyền Ngược 86
PHỤ LỤC B: Cơ Sở Dữ Liệu Ảnh 89
PHỤ LỤC C: Cơ Sở Dữ Liệu Đặc Trưng 93
4
DANH MỤC BẢNG BIỂU
Bảng 1.1: Thống kê lựa chọn đặc trưng của một số hệ thống truy vấn ảnh 15
Bảng 1.2: Bảng thông số 25 màu cơ bản 25
Bảng 1.3: Bảng kết quả thực nghiệm hệ thống của B.G. Prasad, K.K Biswas và
S.K. Gupta 26
Bảng 1.4: Kết quả hệ thống NNFIR 33
Bảng 3.1: Biểu diễn ảnh thành các đặc trưng 60
Bảng 3.2: Thực nghiệm phân hoạch Hạ Long theo mạng con 63
Bảng 3.3: Thực nghiệm phân hoạch Hà Nội theo mạng con 64
Bảng 3.4: Thực nghiệm phân hoạch Nha Trang theo mạng con 64
Bảng 3.5: Thực nghiệm phân hoạch qua toàn hệ thống liên mạng 66
Bảng 4.1: Kết quả thực nghiệm một số phương pháp 78
Bảng C.1: Mô tả cơ sở dữ liệu đặc trưng 94
5
DANH MỤC HÌNH VẼ VÀ BIỂU ĐỒ
Hình 1.1: Hệ thống truy vấn ảnh của Yahoo 10
Hình 1.2: Mô hình rút trích đặc trưng thời gian thực 11
Hình 1.3: Mô hình tách riêng cơ sở dữ liệu đặc trưng 12
Hình 1.4: Hệ thống truy vấn ảnh với cơ sở tri thức 13
Hình 1.5: Hệ thống truy vấn ảnh kết hợp màu sắc và kết cấu 22
Hình 1.6: Hai dạng lược đồ mức xám 23
Hình 1.7: Quá trình phân tách mức xám 24
Hình 1.8: Phân vùng vị trí 26
Hình 1.9: Hệ thống truy vấn ảnh NNFIR 27
Hình 1.10: Ảnh gốc 29
Hình 1.11: Ảnh qua phép biến đổi wavelet song trực giao mức 1 29
Hình 1.12: Ảnh qua phép biến đổi wavelet song trực giao mức 2 30
Hình 1.13: Ảnh qua phép biến đổi wavelet song trực giao mức 3 30
Hình 1.14: Mối quan hệ giữa khoảng cách, RBNF và UF 32
Hình 1.15: Kết quả lần truy vấn lần đầu 32
Hình 1.16: Kết quả truy vấn sau khi nhận phản hồi 33
Hình 2.1: Mạng Nơron truyền thẳng 34
6
Hình 2.2: Mẫu X đặc trưng bởi m vector 37
Hình 2.3: Tổng thể hệ thống liên mạng 37
Hình 2.4: Quá trình xử lý của các mạng con 38
Hình 2.5: Phương pháp kết hợp trung bình kết quả các mạng con 39
Hình 2.6: Kết hợp mạng Nơron và thuật giải di truyền (NN_GA) 40
Hình 2.7: Tổng quan mô hình kết hợp bằng hệ thống liên mạng 42
Hình 2.8: Gộp kết quả các mạng con chuẩn bị đưa vào mạng toàn cục 44
Hình 2.9: Đưa các vector R
i
vào mạng kết hợp 46
Hình 2.10: Phân lớp mẫu m vector 46
Hình 2.11: Mô hình liên mạng (m, n, L) 47
Hình 2.12: Huấn luyện mạng con RN
1
của hệ thống liên mạng meta-Nơron
(m, n, L) 49
Hình 2.13: Huấn luyện mạng thành phần TP
1
của hệ thống liên mạng
meta-Nơron (m, n, L) 51
Hình 2.14: Sơ đồ rút trích đặc trưng 54
Hình 2.15: Kiến trúc hệ thống liên mạng meta-Nơron áp dụng trên ảnh 56
Hình 3.1: Sơ đồ rút trích đặc trưng 58
Hình 3.2: Ảnh đầu vào 60
Hình 3.3: Hệ thống liên mạng (m=4, n=5, L=3) 62
7
Hình 3.4: Biểu đồ thực nghiệm mạng phân lớp Hạ Long 67
Hình 3.5: Biểu đồ thực nghiệm mạng phân lớp Hà Nội 67
Hình 3.6: Biểu đồ thực nghiệm mạng phân lớp Nha Trang 67
Hình 3.7: Tổng quan quá trình xử lý của hệ thống liên mạng cụ thể
(m=4, n=5, L=3) 69
Hình 4.1: Ảnh gốc dùng truy vấn 70
Hình 4.2: Phần nền và phần nổi 71
Hình 4.3: Vùng 1 71
Hình 4.4: Vùng 2 72
Hình 4.5: Vùng 3 72
Hình 4.6: Vùng 4 73
Hình 4.7: Cập nhật đặc trưng vào cơ sở dữ liệu 74
Hình 4.8: Huấn luyện với số nút ẩn tối ưu 76
Hình 4.9: Kết quả truy tìm vùng du lịch 77
Hình 4.10: Chức năng thống kê xác định vùng du lịch 78
Hình 4.11: Biểu đồ so sánh một số phương pháp 79
Hình A.1: Mạng Nơron 86
Hình A.2: Hoạt động của một Nơron 86
Hình A.3: Một số hàm truyền 87
8
Hình B.1: Ảnh huấn luyện 1 89
Hình B.2: Ảnh huấn luyện 2 89
Hình B.3: Ảnh huấn luyện 3 90
Hình B.4: Ảnh huấn luyện 4 90
Hình B.5: Ảnh kiểm tra 1 91
Hình B.6: Ảnh kiểm tra 2 91
Hình B.7: Ảnh kiểm tra 3 92
Hình B.8: Ảnh kiểm tra 4 92
Hình C.1: Cơ sở dữ liệu đặc trưng 93
9
Chương 1:
TỔNG QUAN VỀ TRUY VẤN ẢNH
VÀ CÁC HƯỚNG TIẾP CẬN
1.1 Giới thiệu chung
Xử lý ảnh là lĩnh vực nghiên cứu đang phát triển không ngừng bởi tính trực
quan sinh động cũng như khả năng áp dụng vào thực tế lớn. Hiện xử lý ảnh đang
giành được nhiều sự quan tâm của các nhà nghiên cứu trong và ngoài nước. Trong
xử lý ảnh, truy vấn ảnh có thể nói là lĩnh vực đòi hỏi sự nghiên cứu tổng hợp:
nghiên cứu xử lý ảnh để rút trích các đặc trưng, áp dụng các tính toán toán học cao
cấp để xác định mức độ tương đồng giữa hai ảnh và sự tổ chức sắp xếp chỉ mục cho
cơ sở dữ liệu ảnh. Chính vì thế truy vấn ảnh là lĩnh vực nghiên cứu đem lại nhiều
thú vị.
Hơn nữa, cùng với sự phát triển của phần mềm và phần cứng, khối lượng ảnh
phát triển không ngừng và ngày càng lớn. Một số lượng lớn các ảnh đang được sử
dụng ở trong thư viện ảnh số và trên web. Vì vậy nhu cầu tìm kiếm ảnh là một nhu
cầu tất yếu. Hiện tại, truy vấn ảnh ứng dụng trong khá nhiều lĩnh vực như: quản lý
nhãn hiệu logo, truy tìm tội phạm, ứng dụng trong y khoa, quân sự …
Bài toán tìm kiếm ảnh trong Cơ Sở Dữ Liệu (CSDL) ảnh được đưa ra từ cuối
năm 1970 và có nhiều cách giải quyết khác nhau. Cho đến ngày nay đã có rất nhiều
hệ thống truy vấn ảnh (cả thương mại lẫn thực nghiệm) đã và đang được phát triển.
Có hai dạng CSDL ảnh là: CSDL ảnh tĩnh và CSDL ảnh động (ảnh video…).
Trong nghiên cứu này, chỉ xin xem xét đến phạm vi ảnh tĩnh.
Mục tiêu của hệ thống truy vấn ảnh là tìm ra ảnh đúng với nhu cầu của người
dùng:
10
Hình 1.1: Hệ thống truy vấn ảnh của Yahoo
Các hệ thống truy vấn ảnh hiện nay rất đa dạng nhưng nhìn chung thì chúng
được phân biệt bởi: các đặc trưng mà hệ thống rút trích từ ảnh để làm cơ sở truy vấn
và phương pháp phân đoạn ảnh được sử dụng trong hệ thống truy vấn, cách thức tổ
chức chỉ mục cho CSDL ảnh, độ đo sự tương đồng giữa hai ảnh. Độ đo sự tương
đồng là hàm số d:HxHÆR
+
thỏa các tính chất sau với mọi ảnh I, J, K trong không
gian các ảnh H [15]:
Tính tự tương đồng (self similarity): d(I, I) = d(J, J)
Tính đối xứng (synmetry): d(I, J) = d(J, I)
Tính bắc cầu (triangular inequality): d(I, K) + d(K, J) >= d(I, J)
11
Tính tối tiểu (minimality): d(I, J) >= d(I, I)
Các hệ thống truy vấn ảnh thường tuân theo một trong các mô hình sau:
CSDL
ảnh
Ảnh truy vấn
Yêu cầu
truy vấn
Rút trích đặc
trưng và độ đo sự
tương đồng
Xuất ra
Tập ảnh
kết quả
Hình 1.2: Mô hình rút trích đặc trưng thời gian thực
Mô hình này đơn giản, dễ cài đặt nhưng đưa vào ứng dụng thực tế sẽ chậm vì
nhược điểm: khi có một yêu cầu truy vấn ảnh hệ thống không những phải rút trích
các đặc trưng của ảnh truy vấn mà còn phải rút trích các đặc trưng của ảnh trong tập
ảnh của CSDL ảnh, sau đó tính toán mức độ tương đồng giữa chúng. Mô hình này
thích hợp để cài đặt thử nghiệm và ghi nhận kết quả trong quá trình thực nghiệm để
lựa chọn các đặc trưng cần rút trích cũng như độ đo sự tương đồng hiệu quả nhất.
Đăng ký:
Đăng Nhận xét (Atom)
Không có nhận xét nào:
Đăng nhận xét