Category Archives: Café

Chương 6: Lập thiết bị đo đạc Trái đất: Khoa học môi trường và mạng lưới đầu đo thế hệ mới

Trở về Mục lục cuốn sách

Michael Lehning, Nicholas Dawes, Mathias Bavay | WSL Institute for Snow and Avalanche Research SLF
Marc Parlange | École Polytechnique Fédérale de Lausanne
Suman Nath, Feng Zhao | Microsoft Research

Những thử thách liên quan đến môi trường rộng khắp cùng nhận thức càng tăng về biến đổi khí hậu toàn cầu đang cho thấy một nhu cầu cấp thiết đối với các nhà khoa học môi trường về việc tiến hành nghiên cứu khoa học theo cách mới, tốt hơn. Các hệ thống quan trắc môi trường cỡ lớn sẵn có, với độ phân giải không-thời gian rất thưa, không chỉ đắt mà còn không thể chỉ ra những mối tương tác phức tạp giữa các thành phần khí quyển và mặt đất với đủ độ chuẩn xác để tạo thành các mô hình hệ thống môi trường chính xác. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV, Tin học

Chương 5: Kéo bầu trời đêm lại gần hơn: Khám phá từ dòng lũ dữ liệu

Trở về Mục lục cuốn sách

Alyssa A. Goodman | Harvard University
Curtis G. Wong | Microsoft Research

Trong suốt lịch sử, các nhà thiên văn đã quen với dữ liệu đến từ bầu trời. Nhưng các khả năng tương đối mới của chúng ta cho phép lưu trữ dữ liệu bầu trời vào trong các “đám mây” mở ra những phương pháp mới và thú vị để truy cập, phân phối, sử dụng và phân tích dữ liệu, cả trong nghiên cứu lẫn giáo dục. Ở đây ta xét đến ba câu hỏi có liên quan lẫn nhau: (1) Những xu hướng nào mà ta đã và sắp thấy về mức độ tăng trưởng của việc thu thập dữ liệu từ kính viễn vọng? (2) Liệu ta sẽ có lời giải nào cho thử thách ngày một lớn lên của việc tìm thấy cây kim điển hình trong đống rơm dữ liệu này nhằm tiến hành khám phá khoa học? (3) Những vận hội nào ta sẽ nắm được trong tương lai xét về phân tích tính toán và hiển thị số liệu? Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Chương 4: Tầm nhìn năm 2020 về hải dương học

Trở về Mục lục cuốn sách

John R. Delaney | University of Washington
Roger S. Barga | Microsoft Research

Đại dương là lớp bảo vệ cuối cùng trên bề mặt Trái đất. Che phủ tới 70 phần trăm bề mặt hành tinh chúng ta, nó là quyển lớn nhất và phức tạp nhất mà con người biết đến. Đại dương là một kho chứa nhiệt và hóa chất khổng lồ, luôn hoạt động. Nó thực sự là “cỗ máy” điều khiển hệ thống thời tiết–khí hậu khắp đại dương và lục địa, trực tiếp ảnh hưởng đến sản xuất thực phẩm, hạn hán và lũ lụt trên đất liền. Nước cũng là màng chắn bức xạ điện từ khá tốt, vì vậy ta không dò được hết địa hình đáy biển như đã làm được đối với bề mặt của Sao Hỏa và Sao Kim. Và mặc dù mối liên hệ về không gian nội trong lòng đại dương đã được bước đầu được tìm hiểu song những biến động dài và ngắn hạn cùng những phức tạp trong động lực biển vẫn chưa được hiểu rõ. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Chương 3: Định nghĩa lại sinh thái học có sử dụng dữ liệu

Trở về Mục lục cuốn sách

James R. Hunt | University of California, Berkeley and the Berkeley Water Center
Dennis D. Baldocchi | University of California, Berkeley
Catharine van Ingen | Microsoft Research

Sinh thái học là ngành nghiên cứu về sự sống và tương tác của nó với môi trường vật lý xung quanh. Vì tình hình biến đổi khí hậu yêu cầu sự thích nghi nhanh chóng, nên các công cụ phân tích mới đóng vai trò thiết yếu để định lượng những thay đổi đó trong số những biến động tự nhiên vốn có. Sinh thái là ngành khoa học trong đó nghiên cứu thường được thực hiện bởi nhóm nhỏ các cá nhân, với dữ liệu ghi chép trong sổ tay. Nhưng ngày nay các nghiên cứu tổng hợp cỡ lớn đang được nỗ lực thực hiện bởi sự hợp tác giữa hàng trăm nhà khoa học. Những nỗ lực lớn hơn này là rất cần thiết vì hiện giờ có hai sự phát triển: một là khoa học được thực hiện bằng cách nào, và hai là những câu hỏi về quản lý tài nguyên được đặt ra. Dù những nghiên cứu tổng hợp có sự hợp tác vẫn còn đang trong giai đoạn hình thành nhưng tầm quan trọng ngày càng tăng của chúng đã rõ ràng. Sự hỗ trợ của máy tính luôn gắn liền với những hình thức hợp tác như vậy và là then chốt đối với quá trình nghiên cứu. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Chương 2. Ngành khoa học mới bắt nguồn từ những ứng dụng trong lĩnh vực môi trường

Trở về Mục lục cuốn sách

Jeff Dozier | University of California, Santa Barbara
William B. Gail | Microsoft

Khoa học về Trái đất và môi trường đã trưởng thành qua hai giai đoạn chính và đang bước vào giai đoạn thứ ba. Trong giai đoạn đầu tiên, vốn đã kết thúc cách đây hai thập kỉ, khoa học Trái đất và môi trường đa phần là mang tính chuyên môn và tập trung vào việc phát triển kiến thức về địa chất, hóa học khí quyển, hệ sinh thái, và các lĩnh vực khác của hệ Trái đất. Đến thập niên 1980, cộng đồng khoa học đã nhận ra sự ràng buộc chặt chẽ giữa các chuyên môn này và bắt đầu nghiên cứu chúng như những thành tố của một hệ thống đơn nhất. Trong suốt giai đoạn thứ hai này, mẫu hình của khoa học hệ thống Trái đất đã xuất hiện. Đi cùng nó là khả năng hiểu được các hiện tượng phức tạp, có tính hệ thống như biến đổi khí hậu, vốn kết nối giữa các khái niệm về khoa học khí quyển, sinh học, và hành vi loài người. Điều cốt yếu để nghiên cứu các hệ thống tương tác trên Trái đất là khả năng tiếp nhận, xử lý, và làm các dữ liệu từ vệ tinh trở nên sẵn có; và đồng thời, các mô hình mới đã được xây dựng để thể hiện những ý tưởng đang phát triển của chúng ta về các quá trình phức tạp bên trong hệ thống Trái đất đầy biến động [1]. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV, Sách

Chương 1: Định luật Gray: Tính toán khoa học lấy dữ liệu làm trung tâm

Trở về Mục lục cuốn sách

Alexander S. Szalay | The Johns Hopkins University
José A. Blakeley | Microsoft

Sự bùng nổ dữ liệu khoa học đã tạo ra một thử thách lớn đối với các dự án khoa học hiện đại. Với những tập hợp dữ liệu vượt ngoài phạm vi hàng chục terabyte, các nhà khoa học không có những giải pháp sẵn có nào để quản trị và xử lý dữ liệu ngay được [1]. Các dự án thành công đến giờ đều bố trí kết hợp những tập tin rời và cơ sở dữ liệu [2]. Tuy nhiên, phần lớn các giải pháp này đều được chỉnh lại cho từng dự án cụ thể và không thể dễ dàng khái quát hóa hay dãn ra để phù hợp với các thí nghiệm thế hệ mới được. Hơn nữa, các kiến trúc máy tính hiện đại ngày càng mất cân đối; khoảng cách về độ trễ giữa các bộ vi xử lý nhiều lõi với các ổ cứng cơ học càng nới rộng theo từng năm, làm cho thử thách đối với tính toán thiên về dữ liệu càng khó được đón nhận [3]. Điều mà ta cần là một phương pháp tổng quát và có hệ thống để giải quyết các vấn đề này với một kiến trúc mà có thể điều chỉnh trong tương lai. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Phần I: Trái đất và môi trường

Trở về Mục lục cuốn sách

Trái đất & Môi trường

Lời giới thiệu

Dan Fay | Microsoft Research

Sự thay đổi là không thể tránh khỏi—vũ trụ nở rộng, giới tự nhiên tiến hóa và phát triển, và vì vậy những công cụ khoa học và kĩ thuật ta dùng cũng phải phát triển theo, để đáp ứng được công cuộc truy tìm không khoan nhượng những kiến thức khoa học sâu xa hơn về không gian, Trái đất, và môi trường. Vận hội và thử thách đặt ra là rất nhiều. Những công nghệ tính toán mới như điện toán đám mây và bộ vi xử lý nhiều lõi, dưới hình thức chung, đều không đủ cung cấp một giải pháp tổng thể. Nhưng sự áp dụng đúng thời điểm và hiệu quả của những công nghệ như vậy có thể giúp ta có bước tiến đáng kể về tầm hiểu biết đối với thế giới, bao gồm các thử thách về môi trường, và cách thức ứng phó với chúng. Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Jim Gray nói về eScience: một phương pháp khoa học qua chuyển đổi

Trở về Mục lục cuốn sách

Dựa trên băng ghi lại bài thuyết trình của Jim Gray trước NRC_CSTB1 tại Mountain View, CA, ngày 11/1/20072

Biên tập: Tony Hey, Steward Tansley, và Kristin Tolle | Microsoft Research

Chúng ta cần phải thực hiện tốt hơn công việc tạo ra các công cụ hỗ trợ cho toàn bộ quá trình nghiên cứu—từ thu thập dữ liệu, xử lý dữ liệu đến phân tích và hiển thị dữ liệu. Ngày nay, các công cụ để thu thập dữ liệu, kể cả vĩ mô và vi mô đều tuyệt vời. Sau khi thu thập dữ liệu, bạn cần xử lý nó trước khi có thể làm bất kì việc phân tích dữ liệu nào; và chúng ta đang thiếu những công cụ tiện dụng cho cả việc xử lý lẫn phân tích dữ liệu. Sau đó là đến xuất bản các kết quả trong công trình nghiên cứu của bạn, mà những tài liệu đã được công bố chỉ là phần nổi của tảng băng dữ liệu mà thôi. Nói vậy, ý của tôi là chúng ta thu thập rất nhiều dữ liệu rồi chiết xuất thành một vài cột trên trang báo Science hoặc Nature—hoặc thành 10 trang, nếu đó là một bài do người làm khoa học máy tính viết. Vậy tôi nói “tảng băng dữ liệu” nghĩa là có rất nhiều dữ liệu được thu thập nhưng không được xử lý hay xuất bản theo cách có hệ thống. Vẫn có những ngoại lệ, và tôi nghĩ rằng những trường này là nơi thích hợp để ta tìm ra những kinh nghiệm hay. Tôi sẽ nói về cách mà toàn bộ quá trình bình duyệt cần phải thay đổi và cách mà trong đó, tôi nghĩ rằng nó đang thay đổi cùng những việc mà CSTB có thể làm để giúp tất cả chúng ta truy cập được đến việc nghiên cứu của bản thân.

Tiếp tục đọc

%(count) bình luận

Filed under Mẫu hình IV

Mẫu hình thứ tư: Khám phá khoa học thiên về dữ liệu

4th-paradigm

The Fourth Paradigm: Data-Intensive Scientific Discovery

Cuốn sách này trình bày tầm nhìn mở rộng đầu tiên về lĩnh vực mới xuất hiện: khoa học thiên về dữ liệu, với mục đích tạo ảnh hưởng đến cộng đồng khoa học và điện toán toàn thế giới, đồng thời động viên thế hệ các nhà khoa học kế tiếp. Các bước đột phá trong khoa học sẽ ngày càng được tiếp sức bởi khả năng tính toán tiến bộ, giúp cho nhà nghiên cứu xử lý và khám phá những bộ số liệu khổng lồ. Tốc độ tiến bước của bất kì ngành khoa học nào cũng sẽ phụ thuộc vào việc liệu các nhà nghiên cứu hợp tác với nhau, và với các chuyên gia công nghệ hiệu quả đến mức nào, trong các lĩnh vực của khoa học điện toán (eScience) chẳng hạn như các công nghệ cơ sở dữ liệu, quản lý quy trình làm việc, hiển thị số liệu, và điện toán đám mây. Tập hợp các bài viết này sẽ tiếp tục mở rộng tầm nhìn đề xuất bởi nhà khoa học máy tính tiên phong, Jim Gray, về một mẫu hình mới, mẫu hình thứ tư về khám phá dựa trên khoa học thiên về dữ liệu và đề xuất chi tiết cách thức làm hiện thực lý thuyết này. (Lời giới thiệu từ Amazon.com)

Bài viết phát hành theo giấy phép Creative Commons Attribution-ShareAlike 3.0. Bạn có thể phân phối lại và sửa đổi, miễn là ghi nguồn.

Mục lục

Mở đầu: Jim Gray nói về eScience: Một phương pháp khoa học qua chuyển đổi
Phần I: Trái Đất và môi trường
Chương 1: Định luật Gray: tính toán khoa học lấy cơ sở dữ liệu làm trung tâm
Chương 2: Ngành khoa học mới bắt nguồn từ những ứng dụng trong lĩnh vực môi trường
Chương 3: Định nghĩa lại sinh thái học có sử dụng dữ liệu
Chương 4: Tầm nhìn năm 2020 về hải dương học
Chương 5: Kéo bầu trời đêm lại gần hơn: khám phá từ dòng lũ dữ liệu
Chương 6: Lập thiết bị đo đạc Trái đất: khoa học môi trường và các đầu đo thế hệ kế mới

Tiếp tục đọc

8 phản hồi

Filed under Mẫu hình IV