Chương 4: Quá trình nhìn ảnh

Nhiều ứng dụng xử lý ảnh được lập ra nhằm mục đích tạo các ảnh để con người nhìn (trái với, chẳng hạn, mục đich tự động nhận dạng.) Vì vậy ta rất cần hiểu được những đặc tính cũng như hạn chế của hệ thống thị giác của người—để hiểu được “bộ phận tiếp nhận” các tín hiệu 2 chiều. Đầu tiên ta cần nhận thấy rằng 1) hệ thống thị giác ở người vẫn chưa được hiểu rõ, 2) không có thang đo khách quan nào để đánh giá chất lượng của ảnh tương ứng với cách con người nhận xét về chất lượng ảnh, và 3) không có mẫu người quan sát “điển hình” nào. Mặc dù vậy, nghiên cứu trong tâm lý nhìn nhận ở người đã mang lại những điều ẩn sâu trong hệ thống thị giác. Bạn có thể tìm đọc, chẳng hạn Stockham.1

Độ nhạy sáng

Có vài cách khác nhau để mô tả độ nhạy của hệ thống thị giác của người. Trước hết, ta hãy giả sử rằng một vùng đồng nhất trong tấm ảnh có một cường độ sáng như một hàm của bước sóng (hay màu) cho bởi I(λ). Tiếp theo ta hãy giả sử rằng I(λ) = I0, một hằng số.

Độ nhạy của bước sóng

Cường độ mà người nhìn thấy được là một hàm của λ; hàm này là độ nhạy phổ, đối với “người quan sát điển hình” có dạng như trên Hình 10.2

image

Hình 10. Độ nhạy phổ của người quan sát “điển hình”.

Độ nhạy kích thích

Nếu cường độ (độ sáng) không đổi I0 được phép thay đổi thì độ phản hồi thị giác, R, sẽ gần như tỉ lệ với loga của cường độ. Đây là định luật Weber-Fechner:

log(I0)             (45)

Hàm ý của điều này cũng dễ được minh họa. Để có những bước độ sáng đều đặn, qua mắt nhìn, Δk, thì cần phải có độ sáng tự nhiên (hay yếu tố kích thích) tăng theo cấp hàm số mũ. Điều này được minh họa trên Hình 11ab.

Dải màu thuộc nửa trên của Hình 11a tương ứng với mức tăng tuyến tính của độ sáng về mặt khách quan (Hình 11b), nhưng lại có dạng mức tăng loga nếu nhìn theo chủ quan. Dải màu nửa dưới của Hình 11a tương ứng với mức tăng hàm mũ theo độ sáng về mặt khách quan (Hình 11b) song lại tăng với mức tuyến tính về độ sáng theo chủ quan.

image

Hình 11a (trái). Nửa trên có bước độ sáng ΔI=k. Nửa dưới có bước độ sáng ΔI=kI. Hình 11b (phải). Độ sáng thật cùng với các giá trị được nội suy.

Hiệu ứng dải Mach có thể thấy được qua Hình 11a. Mặc dù độ sáng tự nhiên là không đổi dọc theo các vệt màu nhưng người quan sát vẫn nhìn nhận rằng độ sáng ở bậc phân cách giữa hai vệt màu có sự “trồi lên” và “thụt xuống”. Như vậy, ngay trước bậc phân cách, ta thấy có sự giảm độ sáng một chút so với giá trị độ sáng thực. Ngay sau bậc phân cách ta thấy có sự tăng độ sáng một chút so với giá trị độ sáng thực. Hiệu ứng tổng cộng là một độ tương phản được tăng cường được nhìn thấy, riêng ở vị trí bậc phân cách độ sáng.

Độ nhạy tần số không gian

Nếu cường độ (độ sáng) không đổi I0 được thay thế bởi “chấn song” hình sin với tần số không gian ngày càng tăng (Hình 12a) thì ta có thể xác định được độ nhạy tần số không gian. Kết quả được chỉ ra trên Hình 12b.3 4

image

Hình 12a (trái). Chấn song kiểm tra hình sin. Hình 12b (phải). Độ nhạy tần số không gian.

Để diễn giải số liệu này dưới dạng bình dân hơn, ta hãy xét một màn hình máy tính “lý tưởng” được nhìn từ khoảng cách 50 cm. Tần số không gain cho ta phản hồi cao nhất là ở mức 10 chu kỳ với mỗi độ góc. (Xem Hình 12b.) Một độ góc ở khoảng cách 50 cm sẽ được quy đổi thành 50 tan(1) = 0,87 cm trên màn hình máy tính. Như vậy tần số không gian của phản hồi cao nhất là fmax =10 chu kì / 0,87 cm = 11,46 chu kì/cm ở khoảng cách này. Chuyển đổi nó thành một công thức tổng quát ta được:

eq46         chu kì / cm          (46)

trong đó d = khoảng cách nhìn tính theo cm.

Độ nhạy màu sắc

Sự nhìn nhận màu sắc của con người là chủ đề ngày càng trở nên phức tạp. Vì vậy chúng tôi sẽ chỉ trình bày một đoạn giới thiệu ngắn. Bản chất vật lý của nhìn thấy màu được dựa trên ba sắc tố có trong võng mạc của người.

Người quan sát chuẩn

Dựa trên các kết quả đo nhân trắc học, các đồ thị đường cong tiêu chuẩn được CIE (Commission Internationale de l’Eclairage) chấp nhận là những đường cong biểu thị mức độ nhạy của người quan sát “điển hình” với ba “sắc tố” \bar{x}(\lambda), \bar{y}(\lambda), \bar{z}(\lambda). Chúng được thể hiện trên Hình 13. Đây không phải là các đặc tính hấp thụ sắc tố thực tế tìm được ở võng mạc người “tiêu chuẩn”, nhưng là các đường cong mức độ nhạy được xây dựng từ số liệu thực tế.5

image
Hình 13. Các đường cong mức độ nhạy theo phổ của người quan sát chuẩn.

Đối với một vùng bất kì trên hình với cường độ là hàm của bước sóng (màu) cho bởi I(λ), ba phản hồi trên được gọi là giá trị ba kích thích (trisimulus values):

\displaystyle{  X = \int_0^\infty I(\lambda)\bar{x}(\lambda) d\lambda \quad  Y = \int_0^\infty I(\lambda)\bar{y}(\lambda) d\lambda \quad  Z = \int_0^\infty I(\lambda)\bar{z}(\lambda) d\lambda  }

Tọa độ màu CIE

Tọa độ màu để mô tả thông tin màu nhìn thấy được định nghĩa như sau:

/ (Z)           Y/(Z)           = 1 – (y)         (48)

Tọa độ sắc đỏ được cho bởi x và sắc xanh được cho bởi y. Ba giá trị kích thích có dạng tuyến tính theo I(λ) và do đó thông tin cường độ tuyệt đối bị mất đi trong phép tính tọa độ tọa độ màu {x,y}. Tất cả mọi phân bố màu I(λ) nào được người quan sát nhìn thấy có màu giống nhau thì đều phải có cùng tọa độ màu.

Nếu ta dùng một nguồn chỉnh được chứa màu thuần khiết (như laser thuốc nhuộm) thì cường độ có thể được mô hình hóa là I(λ)=δ(λ-λ0) với δ(•) là hàm xung. Tập hợp các tọa độ màu {x,y} được phát sinh bằng cách thay đổi λ0 sẽ cho ta tam giác màu CIE như trên Hình 14.

image

Hình 14. Biểu đồ màu bao gồm tam giác màu CIE ứng với các màu phổ thuần khiết cùng tam giác màu ứng với phốt-pho CRT.

Các màu đơn sắc thuần khiết nằm dọc theo đường biên của tam giác màu. Tất cả những màu khác đều nằm trong tam giác này. Tọa độ biểu thị màu ứng với một số nguồn tiêu chuẩn được liệt kê ở Bảng 6.

Bảng 6. Tọa độ màu của các nguồn tiêu chuẩn

Nguồn x y
Đèn huỳnh quang ở 4800  ∘ K 0,35 0,37
Mặt Trời ở 6000  ∘ K 0,32 0,33
Phốt-pho đỏ (europi yttri vanađat) 0,68 0,32
Phốt-pho lục (kẽm cađimi sunfit) 0,28 0,60
Phốt-pho lam (kẽm sunfit) 0,15 0,07

Những mô tả về màu sắc dựa trên tọa độ màu không chỉ cho phép phân tích màu mà còn hình thành một kĩ thuật tổng hợp. Bàng cách trộn hai nguồn màu, ta có thể phát sinh ra được một màu bất kì dọc trên đường thẳng nối hai điểm màu đó. Vì ta không thể có một số âm các photon được, nên đồng nghĩa với việc các hệ số trộn lẫn phải là số dương. Bằng cách dùng ba nguồn màu như phốt-pho đỏ, lục và lam trên màn hình CRT ta sẽ thu được tập hợp các màu nằm bên trong hình “tam giác phốt-pho” trên Hình 14.

Những công thức để chuyển đổi qua lại giữa bộ ba giá trị kích thích (X,Y,Z) và các màu CRT thông dụng (R,G,B) được cho bởi:

\displaystyle{  \left[ \begin{array}{c} R \\ G \\ B \end{array} \right] =  \left[ \begin{array}{ccc}  1,9107 & -0,5326 & -0,2883 \\  -0,9843 & 1,9984 & -0,0283 \\  0,0583 & -0,1185 & 0,8986  \end{array} \right]  \bullet  \left[ \begin{array}{c} X \\ Y \\ Z \end{array} \right]}           (49)


\displaystyle{  \left[ \begin{array}{c} X \\ Y \\ Z \end{array} \right] =  \left[ \begin{array}{ccc}  0,6067 & 0,1736 & 0,2001 \\  0,2988 & 0,5868 & 0,1143 \\  0,0000 & 0,0661 & 1,1149  \end{array} \right]  \bullet  \left[ \begin{array}{c} R \\ G \\ B \end{array} \right]} (50)

Miễn là vị trí của màu cần thu được (XYZ) nằm trong tam giác phốt-pho ở Hình 14 thì các giá trị RGB được tính theo PT (49) sẽ dương và do đó dùng được để điều khiển màn hình CRT.

Sẽ không đúng nếu ta giả thiết rằng một sự dịch chuyển nhỏ ở bất cứ nơi nào trong biểu đồ màu (Hình 14) sẽ gây ra một sự thay đổi nhỏ tỉ lệ tương ứng trong màu được nhìn thấy. Không gian màu được xây dựng theo kinh nghiệm trong đó thỏa mãn tính chất tỉ lệ nói trên là khôn gian (u‘,v‘) sau:

u‘ = 4/ (–2+ 12+ 3)           v‘ = 9/ (–2+ 12+ 3)

= 9u‘ / (6u‘ – 16v‘ + 12)         = 4v‘ / (6u‘ – 16v‘ + 12)            (51)

Những thay đổi nhỏ ở hầu như bất kì điểm nào trong không gian màu (u‘,v‘) sẽ tạo ra những thay đổi nhỏ với cùng mức độ trong màu nhìn thấy.

Ảo giác

Việc mô tả hệ thống thị giác con người như trên được hoàn toàn viêt theo ngôn ngữ kĩ thuật. Điều đó có thể dẫn tới kết luận rằng đã có đủ kiến thức về hệ thống thị giác người để cho phép mô hình hóa hệ thống thị giác với những kĩ thuật phân tích hệ thống tiêu chuẩn. Tuy vậy, hệ thống này sẽ quá giản đơn, điều đó thể hiện qua hai ví dụ ảo giác đơn giản sắp tới (Hình 15). Vì vậy phải rất cẩn thận khi sử dụng những mô hình kiểu này.

image

Hình 15. Ảo giác

Hình phái trái tạo ra ảo tưởng nhìn thây các giá trị màu xám, dù rằng não ta “biết chắc” rằng không tồn tại giá trị màu xám nào. Hơn nữa, còn có một cảm giác thay đổi động trong ảnh, một phần là do sự di chuyển của con ngươi mắt. Hình bên phải, tam giác Kanizsa, cho thấy độ tương phản được tăng cường và đường biên giả,6 rõ ràng cả hai hiện tượng này đều không thể giải thích được bằng những khía cạnh riêng về hệ thống nêu trên của quá trình nhìn ar.


  1. Stockham, T.G., Image Processing in the Context of a Visual Model. Proc. IEEE, 1972. 60: p. 828 – 842.
  2. Murch, G.M., Visual and Auditory Perception. 1973, New York: Bobbs-Merrill Company, Inc. 403.
  3. Frisby, J.P., Seeing: Illusion, Brain and Mind. 1980, Oxford, England: Oxford University Press. 160.
  4. Blakemore, C. and F.W.C. Campbell, On the existence of neurons in the human visual system selectively sensitive to the orientation and size of retinal images. J. Physiology, 1969. 203: p. 237-260.
  5. Hunt, R.W.G., The Reproduction of Colour in Photography, Printing & Television, Fourth ed. 1987, Tolworth, England: Fountain Press.
  6. Frisby, J.P., Seeing: Illusion, Brain and Mind. 1980, Oxford, England: Oxford University Press. 160.
Advertisements

1 Phản hồi

Filed under Cơ sở

One response to “Chương 4: Quá trình nhìn ảnh

  1. Pingback: Chương 1: Giới thiệu chung | Blog của Chiến

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s