Chương 6: Lập thiết bị đo đạc Trái đất: Khoa học môi trường và mạng lưới đầu đo thế hệ mới

Trở về Mục lục cuốn sách

Michael Lehning, Nicholas Dawes, Mathias Bavay | WSL Institute for Snow and Avalanche Research SLF
Marc Parlange | École Polytechnique Fédérale de Lausanne
Suman Nath, Feng Zhao | Microsoft Research

Những thử thách liên quan đến môi trường rộng khắp cùng nhận thức càng tăng về biến đổi khí hậu toàn cầu đang cho thấy một nhu cầu cấp thiết đối với các nhà khoa học môi trường về việc tiến hành nghiên cứu khoa học theo cách mới, tốt hơn. Các hệ thống quan trắc môi trường cỡ lớn sẵn có, với độ phân giải không-thời gian rất thưa, không chỉ đắt mà còn không thể chỉ ra những mối tương tác phức tạp giữa các thành phần khí quyển và mặt đất với đủ độ chuẩn xác để tạo thành các mô hình hệ thống môi trường chính xác.

Đặc biệt là trường hợp các vùng núi với bề mặt đất phức tạp—nhiều khi là nơi đầu nguồn nước ngọt cũng như phát sinh ra các dạng mẫu thời tiết.  Lượng dữ liệu cần để hiểu được và mô hình hóa các tương tác như vậy là rất lớn (hàng terabyte, và ngày càng tăng thêm) đến nỗi không có giải pháp thương mại sẵn có nào cho phép nhà khoa học dễ dàng quản lý và phân tích dữ liệu như vậy. Điều này dẫn đến ngày càng tăng nhanh việc hợp tác giữa các nhà khoa học môi trường và khoa học máy tính trên phạm vi toàn cầu, nhằm tiếp cận những vấn đề trên một cách có hệ thống và để phát triển các giải pháp về quan trắc và cơ sở dữ liệu sao cho có thể cho phép các nhà khoa học môi trường tiến hành những thí nghiệm hiện đại của họ.

Khoa học môi trường thế hệ mới

Nền khoa học môi trường thế hệ mới, như được chỉ ra trên Hình 1, được đẩy mạnh bằng những quan sát sau đây của cộng đồng khoa học khí quyển: Trước hết là bài toán thách thức lớn nhất về dự báo thời tiết–khí hậu được biểu diễn bởi các quá trình tương tác giữa khí quyển và mặt đất. Thứ hai là ảnh hưởng trung bình của một bề mặt hỗn tạp đối với khí quyển có thể sẽ rất khác so với ảnh hưởng tính được bằng cách lấy trung bình một thuộc tính cụ thể của bề mặt như nhiệt độ hoặc độ ẩm [1-3]; sự khác biệt này đặc biệt rõ ở các vùng núi, trong đó độ biến thiên của bề mặt thường rất cao.

Hình 2 chỉ ra một ví dụ cho điều này—bề mặt của vùng núi phức tạp với đá gốc, lớp băng vĩnh viễn bị rác che phủ, lớp tuyết phủ không đều, cây cối thưa thớt, và lớp đất dày-mỏng khác nhau cùng các loại thực vật khác nhau. Tất cả những đặc điểm này của bề mặt có thể xuất hiện trong một độ phân giải có kích thước 1 km; những yếu tố đó sẽ không được mô hình dự báo thời tiết, kể cả những mô hình thế hệ mới nhất, xét đến. Những mô hình dự báo thời tiết và biến đổi khí hậu sẵn có vẫn hoạt động dựa trên mộ độ phân giải lưới tính quá thô (hàng ki-lô-mét) để có thể định vị được chính xác và rõ ràng sự không đồng nhất của bề mặt ở vùng núi (và các nơi khác). Điều này dẫn đến sai số nghiêm trọng trong việc hiểu và dự đoán.

Hình 1. Ngữ cảnh điển hình của nguồn dữ liệu trong khoa học môi trường thế hệ mới, cùng việc triển khai đầu đo không đồng nhất, bao gồm (1) trạm lưu động, (2) trạm thời tiết kiểu truyền thống với độ phân giải cao, (3) trạm thời tiết quy mô đầy đủ, (4) trạm thời tiết ngoài, (5) ảnh vệ tinh, (6) ra-đa thời tiết, (7) ra-đa thời tiết lưu động, (8) quan sát tại sông suối, (9) đo đạc do người dân cung cấp, (10) LIDAR mặt đất, (11) LIDAR trên không, (12) đo khí ni-tơ/mê-tan, (13) đầu đo thủy văn băng tuyết và hiện tượng lở tuyết, (14) đầu đo địa chấn, (15) cảm biến nhiệt độ phân bố bằng sợi quang, (16) lấy mẫu chất lượng nước, (17) trạm đo dòng chảy trên sông, (18) nghiên cứu sạt lở nhanh, (19) trạm đo dòng chảy mặt, và (20) nghiên cứu đất.

Với khoa học môi trường thế hệ mới, độ phân giải dữ liệu sẽ được xử lý bằng mạng lưới các đầu đo (thường là không dây) được triển khai dày đặc. Những bước phát triển gầy đây trong quan trắc không dây đã mở ra khả năng bố trí đo đạc và cảm ứng giới tự nhiên với độ phân giải và độ thực cao trong suốt thời gian dài. Những kết nối không dây cho phép thu thập dữ liệu một cách tin cậy từ các đầu đo viễn thám rồi gửi về các phòng thí nghiệm để xử lý, phân tích, và lưu trữ. Việc đo đạc với độ phân giải cao như vậy cho phép nhà khoa học hiểu được chính xác hơn sự biến đổi và động thái của các tham biến môi trường. Việc đo đạc bằng thiết bị không dây cũng cho phép nhà khoa học nhìn được, một cách an toàn và thuận tiện, qua việc triển khai đầu đo tại chỗ, đồng thời cho phép họ kích hoạt, gỡ lỗi, kiểm tra việc triển khai này thừ phòng thí nghiệm. Điều này giúp giảm thiểu các lượt đi thăm hiện trường, vốn có thể rất đắt, tốn thời gian, thậm chí còn nguy hiểm.

Hình 2. Những đường quét laser trên mặt đất để đo sự phân bố tuyết phủ trên đỉnh An-pơ cho thấy dạng điển hình là tuyết phủ theo mảng không đều.

Tuy nhiên, việc triển khai các đầu đo một cách dày đặc trong những môi trường khắc nghiệt nơi xa vẫn là thách thức lớn, bởi một số nguyên nhân. Trước hết, toàn bộ quá trình đo đạc, tính toán, và truyền tin phải đạt hiệu quả rất cao về mặt năng lượng để cho các đầu đo có thể vận hành trong một thời gian dài khi dùng các nguồn pin nhỏ, tấm thu năng lượng mặt trời, hoặc năng lượng khác từ môi trường. Thứ hai, các đầu đo cùng kết nối truyền tin phải rất ổn định để đảm bảo thu nhận được dữ liệu một cách tin cậy trong điều kiện môi trường ngoài trời khắc nghiệt. Thứ ba, các dữ liệu sai xảy ra do hỏng máy hoặc tác động môi trường phải được phát hiện và xử lý phù hợp (chẳng hạn, đánh dấu hoặc thậm chí là loại khỏi dãy số liệu). Mặc dù những nhiêu cứu gần đây (bao gồm Swiss Experiment và Life Under Your Feet) đã phần nào xử lý được những vấn đề nêu trên, song cần nghiên cứu thêm để xử lý trong nhiều hệ thống đang vận hành khác.

Quản lý và khám phá những lượng thông tin lớn thu được từ đầu đo

Kĩ thuật đo đạc môi trường với độ phân giải cao đang đặt ra những thử thách lớn về việc quản lý dữ liệu cho nhà khoa học. Những thử thách này bao gồm việc đảm bảo lưu trữ lượng lớn (nhiều terabyte) dữ liệu, chia sẻ dữ liệu này giữa những người dùng theo các chính sách truy cập khác nhau, cùng việc duy trì đủ ngữ cảnh và nguồn gốc của dữ liệu từ đầu đo bằng cách dùng các dữ liệu meta đúng [4].

Nhà khoa học môi trường có thể đùng những công cụ cơ sở dữ liệu thương mại để giải quyết nhiều thử thách trong việc quản lý và khám phá đối với dòng dữ liệu khổng lồ được cung cấp. Chẳng hạn, dự án SenseWeb của Microsoft™ [5] cho ta một cơ sở hạ tầng, bao gồm cơ sở dữ liệu Microsoft SQL Server làm nền, để lưu trữ lượng lớn dữ liệu đo đạc có thể nén được và phân phối đến nhiều máy tính khác nhau. SenseWeb cũng duy trì việc đánh chỉ mục dữ liệu và cho phép xử lý truy vấn hiệu quả để giúp người dùng nhanh chóng khám phá bộ số liệu nhằm tìm được những đặc điểm cho việc phân tích chi tiết [5-7]. Nhưng ngay cả với những tính năng này, SenseWeb mới chỉ đánh trúng được phần nổi của tảng băng thách thức về việc quản lý số liệu mà nhà khoa học môi trường phải đối mặt. Rất cần có những công cụ khác nữa để tích hợp một cách hiệu quả số liệu đo đạc với ngữ cảnh phù hợp và cung cấp nguồn gốc của dữ liệu. Việc truy vấn dữ liệu như vậy trong một khung chương trình thống nhất vẫn còn rất khó. Cần có thêm nghiên cứu để xử lý dữ liệu không chắc chắn thu được từ những đầu đo bị nhiễu, và để xử lý nguồn dữ liệu liên tục đến từ những điểm đo ở nhiều nơi.

Để hiểu rõ hơn về các hiện tượng môi trường, nhà khoa học cần xây dựng và áp dụng nhiều mô hình để chuyển đổi dữ liệu đầu đo thành các kết quả khoa học và thực dụng khác. Công nghiệ cơ sở dữ liệu có thể giúp nhà khoa học dễ dàng tích hợp được dữ liệu từ nhiều nguồn khác nhau, và có thể là được phân phối trên Internet, với các đánh giá mô hình và dự báo—một quy trình được gọi là đồng hóa số liệu (data assimilation). Các kĩ thuật khai phá dữ liệu phức tạp có thể cho phép nhà khoa học dễ dàng khám phá những dạng mẫu không-thời gian của số liệu (kể cả theo cách tương tác cũng như xử lý theo lô đối với dữ liệu lưu trữ). Các kĩ thuật mô hình có thể cung cấp những dự đoán chính xác, kịp thời về các hiện tượng như lũ lụt, lở đất, các chu kì tuyết lở, vốn rất có ích trong việc phòng chống thiệt hại, ngay cả khi chỉ dự báo trước vài giờ đồng hồ. Trong ngành khí tượng, việc dự báo rất ngắn hạn như vậy còn được gọi là “nowcasting”.

Các nhà khoa học trong dự án Swiss Experiment [www.swiss-experiment.ch] đã có tiến bộ trong việc đồng hóa số liệu và nowcasting. Một nghiên cứu cụ thể trong dự án này là việc áp dụng các đầu đo và mô hình tiên tiến để dự bán thiên tai trên núi An-pơ [8]. Một nowcast được tinh chỉnh dựa trên dự báo thời tiết vận hành (operational weather forecast) để xác định khu vực mục tiêu có tiềm năng xảy ra cơn bão gây ảnh hưởng đến một vùng núi nhỏ (vài ki-lô-mét vuông).
Dự báo operational weather phải cho phép đủ thời gian để thiết lập các trạm lưu động địa phương (chẳng hạn như các trạm SensorScope [www.swiss-experiment.ch/index.php/SensorScope:Home]) và các thiết bị viễn thám để thăm dò vùng mục tiêu và thiết lập nên các mô hình hiểm họa với độ phân giải cao. Về lâu dài, các mô hình dự báo thời tiết chuyên dụng sẽ được phát triển để cho phép mô phỏng địa phương với độ chuẩn xác cao hơn.

Để nâng cao nhận thức của công chúng về môi trường và nhằm trợ giúp người lập chính sách và ra quyết định, những khám phá hữu ích rút ra từ thí nghiệm khoa học cần được trình bày và phổ biến theo cách thực dụng. Chẳng hạn, SenseWeb cung cấp một giao diện Web có tên SensorMap [www.sensormap.org] trong đó trình bày các yếu tố môi trường hiện tại và trong quá khứ, với hình thức hiển thị dễ hiểu. Chương trình này xếp chồng các lớp bản đồ (chẳng hạn nhóm kí hiệu để chỉ ô nhiễm không khí tại từng điểm điểm hoặc hình ảnh biểu hiện phân bố lượng tuyết rơi) lên một bản đồ địa lý, cho chạy các đoạn hình động biểu diễn dãy số liệu môi trường ngay trên nền bản đồ, và chỉ ra những xu thế quan trọng trong dữ liệu môi trường quá khứ cũng như các tóm tắt hữu ích về dữ liệu môi trường hiện tại. (Xem Hình 3.) Hiện giờ, những chương trình như vậy chỉ hỗ trợ một số có hạn các hình hiển thị, và còn nhiều thử thách cần được giải quyết mới có thể hỗ trợ được các hiển thị cao cấp hơn theo yêu cầu của đông đảo khán giả.

Giám sát môi trường khắp thế giới

Chúng tôi đã mô tả hệ thống giám sát môi trường với hình thức tách rời—chỉ tập trung vào một vùng cụ thể như dãy núi, đồng băng tuyết, hoặc cánh rừng. Đây là cách mà hệ thống môi trường bắt đầu được triển khai. Tuy nhiên, chúng tôi thấy rằng trong tương lai các hệ thống giám sát quy mô lớn hơn nhiều sẽ cho phép các nhà khoa học chia sẻ dữ liệu với nhau, đồng thời kết hợp và phân tích tương quan giữa các bộ số liệu thu nhận được từ hàng triệu đầu đo đặt khắp trên thới giới để thậm chí còn hiểu rõ hơn về các mẫu hình điều kiện môi trường toàn cầu.

Hình 3: SensorMap cho thấy phân bố nhiệt độ trên nền địa hình núi 3 chiều.

Một việc triển khai đầu đo quy mô toàn cầu như vậy sẽ cho ta những ích lợi chưa từng thấy trước đây song cũng có những thử thách. Khi các bộ số liệu đầu đo trở nên lớn hơn, các kĩ thuật quản lý dữ liệu truyền thống (như việc tải dữ liệu vào trong một cơ sở dữ liệu SQL rồi truy vấn) sẽ dễ dàng bộc lộ thiếu sót. Để tránh phải chuyển qua lại một lượng lớn dữ liệu, việc tính toán cần được phân bố và đẩy đến càng gần nguồn dữ liệu càng tốt [7]. Để giảm dung lượng và mức độ truyền tải, dữ liệu cần được nén lại mà không bị giảm chất lượng. Để hỗ trợ việc phân tích dữ liệu với một độ trễ chấp nhận được, việc tính toán nên được thực hiện trên dữ liệu được nén [9]. Những phân tích khoa học cũng hầu hết đều yêu cầu thêm dữ liệu meta, như thông tin chi tiết về đầu đo, cách thiết lập thí nghiệm, nguồn gốc dữ liệu, và các thông tin ngữ cảnh khác. Dữ liệu từ các nguồn khác nhau sẽ phải được tích hợp lại vào trong một khung hệ thống quản lý và tìm hiểu thống nhất  [10].

Hiển nhiên là với những công cụ khoa học máy tính có thể làm được nghiên cứu khoa học môi trường thế hệ mới như vậy, nhưng chỉ khi chúng được dùng bởi chính các nhà khoa học chuyên ngành. Nhằm đẩy mạnh việc được nhà khoa học chuyên ngành chấp nhận, thì những công cụ này phải có tính trực quan, dễ dùng, và vững mạnh [không bị dừng hoạt động khi gặp số liệu xấu—ND]. Hơn nữa, chúng không thể là công cụ “vạn năng” cho mọi lĩnh vực, mà chỉ nên là công cụ chuyên dùng cho lĩnh vực cụ thể, hoặc ít nhất là một biến thể được chỉnh sửa từ công cụ chung. Việc phát triển những công cụ này sẽ liên quan đến: việc nhận diện các vấn đề quan trọng mà những nhà khoa học chuyên ngành đang cố gắng giải đáp, việc phân tích được-mất trong thiết kế, và việc tập trung đến những đặc điểm quan trọng. Dù những phương pháp kĩ thuật ứng dụng như vậy đều phổ biến trong những ứng dụng không thuộc về khoa học, song chúng có xu hướng không được ưu tiên trong các áp dụng của khoa học. Điều này cần được thay đổi.

Kết luận

Sự hợp tác chặt chẽ giữa khoa học môi trường và khoa học máy tính đang đưa ra một phương pháp mới và hay hơn để tiến hành nghiên cứu khoa học thông qua việc thu nhận dữ liệu với độ phân giải cao và độ chuẩn xác cao, làm đơn giản công tác quản lý dữ liệu quy mô lớn, mô hình hóa và khai phá dữ liệu, và chia sẻ, hiển thị dữ liệu một cách hiệu quả. Trong bài viết này, chúng tôi đã vạch ra một số thử thách để mở ra tầm nhin về khoa học môi trường trong tương lai. Một số tiến triển đáng kể đã được thực hiện về lĩnh vực này—chẳng hạn như Swiss Experiment và SenseWeb, trong đó một cơ sở hạ tần dữ liệu môi trường tích hợp được dùng bởi nhiều dự án nghiên cứu lớn về môi trường, với mục đích giáo dục về môi trường, và bởi cá nhân một nhà khoa học. Cùng lúc này, đang có những bước tiến lớn trong các ngành hỗ trợ như công nghệ đầu đo cơ bản. Kì vọng của chúng tôi là tất cả những bước tiến này trong việc đo đạc Trái đất sẽ giúp ta hiện thực hóa ước mơ của khoa học môi trường trong tương lai—cho phép các nhà khoa học, chính phủ, và công chúng hieereu rõ hơn và sống an toàn hơn trong môi trường của chúng ta.

Tài liệu tham khảo

[1] M. Bavay, M. Lehning, T. Jonas, and H. Löwe, “Simulations of future snow cover and discharge in Alpine headwater catchments,” Hydrol. Processes, vol. 22, pp. 95–108, 2009, doi: 10.1002/hyp.7195.

[2] M. Lehning, H. Löwe, M. Ryser, and N. Raderschall, “Inhomogeneous precipitation distribution and snow transport in steep terrain,” Water Resour. Res., vol. 44, 2008, doi: 10.1029/2007WR006545.
[3] N. Raderschall, M. Lehning, and C. Schär, “Fine scale modelling of the boundary layer wind field over steep topography,” Water Resour. Res., vol. 44, 2008, doi: 10.1029/2007WR006544.
[4] N. Dawes, A. K. Kumar, S. Michel, K. Aberer, and M. Lehning, “Sensor Metadata Management and Its Application in Collaborative Environmental Research,” presented at the 4th IEEE Int. Conf. e-Science, 2008.
[5] A. Kansal, S. Nath, J. Liu, and F. Zhao, “SenseWeb: An Infrastructure for Shared Sensing,” IEEE MultiMedia, vol. 14, no. 4, pp. 8–13, Oct. 2007, doi: 10.1109/MMUL.2007.82.
[6] Y. Ahmad and S. Nath, “COLR-Tree: Communication Efficient Spatio-Temporal Index for a Sensor Data Web Portal,” presented at the Int. Conf. Data Engineering, 2008, doi: 10.1.1.65.6941.
[7] A. Deshpande, S. Nath, P. B. Gibbons, and S. Seshan, “Cache-and-Query for Wide Area Sensor Databases,” Proc. 22nd ACM SIGMOD Int. Conf. Management of Data Principles of Database Systems, 2003, doi: 10.1145/872757.872818.
[8] M. Lehning and C. Wilhelm, “Integral Risk Management and Physical Modelling for Mountainous Natural Hazards,” in Extreme Events in Nature and Society, S. Albeverio, V. Jentsch, and H. Kantz, Eds. Springer, 2005.
[9] G. Reeves, J. Liu, S. Nath, and F. Zhao, “Managing Massive Time Series Streams with MultiScale Compressed Trickles,” Proc. 35th Int. Conf. Very Large Data Bases, 2009.
[10] S. Nath, J. Liu, and F. Zhao, “Challenges in Building a Portal for Sensors World-Wide,” presented at the First Workshop on World-Sensor-Web, 2006, doi: 10.1109/MPRV.2007.27.

Advertisements

1 Phản hồi

Filed under Mẫu hình IV, Tin học

One response to “Chương 6: Lập thiết bị đo đạc Trái đất: Khoa học môi trường và mạng lưới đầu đo thế hệ mới

  1. Pingback: Mẫu hình thứ tư: Khám phá khoa học thiên về dữ liệu | Blog của Chiến

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s