Chương 2: Các định nghĩa về ảnh số

Trở về Mục lục cuốn sách

Một ảnh số a[mn] được mô tả trong một không gian 2 chiều được lấy từ ảnh thực a(xy) trong một không gian hai chiều liên tục qua một khâu lấy mẫu ảnh thường được gọi là số hóa. Bản chất toán học của khâu lấy mẫu sẽ được mô tả trong Chương 5. Còn bây giờ ta chỉ xét đến một số định nghĩa cơ bản gắn liền với ảnh số. Hiệu ứng của việc số hóa được biểu thị trên Hình 1.

Tấm hình 2 chiều liên tục a(xy) được chia thành N hàngM cột. Giao điểm của một hàng và một cột được gọi là điểm ảnh. Giá trị được gán cho các tọa độ số nguyên [mn], với {= 0, 1, 2, …, M–1}{= 0, 1, 2, …, N–1}a[mn]. Thực ra, trong nhiều trường hợp a(x,y)—mà ta có thể coi là tín hiệu vật lý được tiếp nhận ở bề mặt 2 chiều của thiết bị đo—lại là một hàm số của nhiều biến bao gồm độ sâu (z), màu (λ), và thời gian (t). Nếu không nói gì thêm, trong chương này ta sẽ coi các ảnh đều có dạng 2 chiều, đơn sắc, và là ảnh tĩnh.

Hình 1. Số hóa một ảnh liên tục. Điểm ảnh tại tọa độ [m=10, n=3] có giá trị độ sáng là số nguyên bằng 110.

Ảnh trong Hình 1 được chia thành = 16 hàng và = 16 cột. Giá trị được gán cho mỗi điểm ảnh thì bằng trung bình cộng của các độ sáng trong điểm ảnh, làm tròn về số nguyên gần nhất. Quá trình biểu diễn biên độ của tín hiệu 2 chiều tại một tọa độ xác định như số nguyên với L cấp độ xám khác nhau thì thường được gọ là rời rạc hóa biên độ hay đơn giản hơn là rời rạc hóa.

2.1 Các giá trị thường dùng

Có những giá trị tiêu chuẩn cho các tham số khác nhau mà ta gặp ở xử lý ảnh số. Những giá trị này có thể bắt nguồn từ chuẩn video, do yêu cầu thuật toán, hoặc từ mong muốn giữ kết cấu mạch điện tử được đơn giản. Bảng 1 liệt kê một số giá trị thường gặp.

Bảng 1. Các giá trị thường dùng làm tham số cho ảnh số

Tham số Kí hiệu Các giá trị điển hình
Số hang N 256, 512, 525, 625, 1024, 1080
Số cột M 256, 512, 768, 1024, 1920
Số cấp độ xám L 2, 64, 256, 1024, 4096, 16384

Ta thường thấy các trường hợp = 2K trong đó {= 8, 9, 10, 11, 12}. Điều này xuất phát từ kết cấu mạng điện tử hoặc những thuật toán nhất định như biến đổi Fourier (nhanh) (xem Mục 3.3).

Số các cấp độ xám riêng biệt thường là một số mũ với cơ số là 2, nghĩa là = 2B trong đó B là số bit trong biểu diễn bit của các cấp độ xám. Khi > 1 ta có ảnh theo thang độ xám, còn = 1 cho ta ảnh nhị phân. Trong ảnh nhị phân chỉ có hia cấp độ xám, chẳng hạn như “đen” và “trắng”, hay “0” và “1”.

2.2 Đặc trưng của các phép toán với ảnh

Có nhiều cách phân loại và đặc trưng các phép toán thao tác với ảnh. Lí do của điều này là để hiểu được dạng của những kết quả mà ta muốn thu được khi dùng một kiểu phép toán nhất định hoặc một phép toán nhất định có khả năng gây ra gánh nặng nào trong việc tính toán.

2.2.1 Các kiểu phép toán

Các kiểu phép toán áp dụng được cho ảnh số để chuyển đổi một ảnh đầu vào a[m,n] thành một ảnh đầu ra b[m,n] (hoặc một cách biểu diễn khác) có thể được phân thành ba loại như trong Bảng 2.

Bảng 2. Các kiểu phép toán với ảnh. Kích thước ảnh = N × N; kích thước vùng lân cận = P × P. Lưu ý rằng độ phức tạp được xác định theo số phép toán đối với mỗi điểm ảnh.

Phép toán Đặc trưng Độ phức tạp/pixel nói chung
Điểm Giá trị đầu ra tại một tọa độ nhất định chỉ phụ thuộc theo giá trị đầu vào tại cùng tọa độ đó Hằng số
Địa phương Giá trị đầu ra tại một tọa độ nhất định phụ thuộc theo giá trị đầu vào ở lân cận vị trí tọa độ đó P2
Toàn cục Giá trị đầu ra tại một tọa độ nhất định phụ thuộc theo tất cả các giá trị của ảnh đầu vào N2

Điều này được phác họa trên Hình 2.

Hình 2. Minh họa cho các loại phép toán khác nhau với ảnh.

2.2.2 Các kiểu lân cận

Những phép toán lân cận đóng vai trò then chốt trong xử lý ảnh số hiện đại. Do vậy rất cần hiểu được cách mà các bức ảnh được lấy mẫu và điều này liên quan thế nào đến các dạng lân cận khác nhau được dùng để tiến hành xử lý ảnh.

  • Lấy mẫu chữ nhật — Trong phần lớn các trường hợp, ảnh được lấy mẫu bằng cách trải một lưới hình chữ nhật lên trên tấm ảnh, được minh họa ở Hình 1. Điều này dẫn đến kiểu lấy mẫu như Hình 3ab.
  • Lấy mẫu lục giác — Một sơ đồ lấy mẫu khác được chỉ ra trên Hình 3c và được gọi là lấy mẫu lục giác.

Hình 3a. Lấy mẫu chữ nhật, kết nối 4. Hình 3b. Lấy mẫu chữ nhật, kết nối 8. Hình 3c. Lấy mẫu lục giác, kết nối 6.

Cả hai sơ đồ lấy mẫu đều được nghiên cứu kĩ1 và đều biểu diễn một cách ghép các mảnh theo chu kì để phủ kín một không gian ảnh liên tục. Tuy vậy chúng ta sẽ chỉ chú ý đến cách lấy mẫu chữ nhật vì xét đến yếu tố phần cứng và phần mềm, đây vẫn là phương pháp được chọn.

Các phép toán địa phương tính ra giá trị điểm ảnh b[m0n0] dựa trên các giá trị điểm ảnh ở lân cận của a[m0n0]. Một số dạng lân cận thường gặp nhất là các dạng kết nối 4 và kết nối 8 trong trường hợp lấy mẫu chữ nhật và kết nối 6 trong trường hợp lấy mẫu lục giác, được minh họa trên Hình 3.

2.3 Các thông số video

Chúng tôi không có ý đề cập đến việc xử lý các hình ảnh động trong tài liệu nhập môn này. Tuy nhiên, vì nhiều hình ảnh tĩnh được lấy từ máy quay video và máy ghi hình (frame grabber) nên sẽ hợp lý khi chúng tôi đề cập đến các tiêu chuẩn gắn với ba loại video được dùng rộng rãi trên thế giới—NTSC, PAL, và SECAM. Thông tin này được tóm tắt trong Bảng 3.

Bảng 3. Các thông số video tiêu chuẩn

.                             Chuẩn NTSC PAL SECAM
Thuộc tính
Số hình / giây 29,97 25 25
ms / hình 33,37 40,0 40,0
Số dòng / hình 525 625 625
Ngang/dọc = tỉ lệ ngang 4:3 4:3 4:3
Đan xen 2:1 2:1 2:1
μs / dòng 63,56 64,00 64,00

Trong một ảnh đan xen, các dòng đánh số lẻ (1, 3, 5, …) được quét trong một nửa thời gian hiện hình (tức là 20 ms với PAL), và các dòng số chẵn (2, 4, 6, …) được quét trong nửa thời gian còn lại. Màn hình phải được bố trí phù hợp với cách quét này. (Xem Mục 8.2). Lí do của việc đan xen các dòng quét trong ảnh video là để giảm mức độ nháy mà người xem nhìn thấy. Khi muốn dùng ảnh được quét từ nguồn phát video đan xen, ta cần lưu ý xem liệu phần cứng số hóa có giúp xếp hai nửa của ảnh về đúng chỗ chưa, hay ta phải thực hiện công việc đó bằng phần mềm. Hơn nữa, cách phân tích các vật chuyển động yêu cầu những đặc biệt lưu ý với video đan xen để tránh những cạnh zích-zắc.

Số dòng (N) từ một nguồn video nói chung là tương ứng 1:1 với số hàng trên ảnh video. Tuy nhiên số cột lại phụ thuộc vào bản chất của thiết bị điện tử dùng để số hóa ảnh. Cách thiết bị chụp khác nhau có thể cho = 384; 512; hoặc 768 cột (điểm ảnh mỗi hàng).


  1. Dudgeon, D.E. and R.M. Mersereau, Multidimensional Digital Signal Processing. 1984, Englewood Cliffs, New Jersey: Prentice-Hall.
Advertisements

1 Phản hồi

Filed under Cơ sở

One response to “Chương 2: Các định nghĩa về ảnh số

  1. Pingback: Chương 1: Giới thiệu chung | Blog của Chiến

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s