Cơ sở khoa học tích hợp GIS và viễn thám phục vụ công tác quản lý tài nguyên thiên nhiên

TN&MTTư liệu ảnh viễn thám là nguồn cung cấp dữ liệu không gian quan trọng trong cơ sở dữ liệu GIS. Tư liệu ảnh viễn thám có thể cung cấp dữ liệu mô tả bề mặt đất với phạm vi bao phủ địa lý lớn, độ phân giải cao và chi phí thấp. Tuy nhiên, khi chuyển đổi dữ liệu ảnh viễn thám vào trong hệ thống GIS có nhiều vấn đề xảy ra và đòi hỏi người sử dụng cần đưa ra cách giải quyết phù hợp để nâng cao độ chính xác của kết quả đầu ra. Bài báo tìm hiểu một số vấn đề và giải pháp khi tích hợp dữ liệu viễn thám và GIS.

Với sự phát triển của công nghệ thông tin thì các chức năng chuyển đổi dữ liệu raster đã được cải thiện đáng kể giúp cho việc đưa dữ liệu từ ảnh viễn thám sang một định dạng dữ liệu phù hợp trong hệ thống GIS trở nên dễ dàng và nhanh chóng, phục vụ phân tích và mô hình hoá trong nhiều ứng dụng. Tuy vậy, việc tích hợp ảnh viễn thám và GIS có hiệu quả hay không phụ thuộc lớn vào dữ liệu đầu vào của hai nguồn này, phải tương đồng và thống nhất.

Khi tích hợp dữ liệu ảnh viễn thám với dữ liệu GIS cần biết rằng hạn chế duy nhất của quá trình tích hợp là hai nguồn dữ liệu phải được hiệu chỉnh hình học, tức đưa về cùng toạ độ địa lý. Sử dụng dữ liệu viễn thám làm đầu vào của GIS có hai dạng: Sử dụng kết quả phân loại dữ liệu ảnh vệ tinh và sử dụng trực tiếp ảnh vệ tinh (kết quả sẽ có độ chính xác cao hơn).

Mô hình tích hợp viễn thám và GIS

Cơ sở khoa học tích hợp GIS và viễn thám phục vụ công tác quản lý tài nguyên thiên nhiên

Dữ liệu GIS là tham số đầu vào cho giải đoán ảnh viễn thám: Dữ liệu GIS là đầu vào cho viễn thám thường được biết đến qua các thuật toán phân loại ảnh có kiểm định. Lớp dữ liệu GIS có vai trò rất lớn trong việc giải đoán và xác định mẫu trên nền ảnh viễn thám. Đã có nhiều công trình nghiên cứu về khả năng này, tiêu biểu như nghiên cứu của Volker Water (1998) về sự trợ giúp của dữ liệu GIS trong phân loại ảnh tự động thành lập các bản đồ chuyên đề cho ba loại tỉ lệ 1:25000, 1:200 000 và 1:1000000. Hay nhóm nghiên cứu của Becker, C và ctv (2000) đã giới thiệu quy trình tự động kiểm tra dữ liệu cập nhật bằng công nghệ viễn thám để đánh giá chất lượng của kết quả sau khi phân loại. Bên cạnh đó, dữ liệu GIS được sử dụng phổ biến trong các ứng dụng nghiên cứu chiết tách các thông tin gián tiếp từ viễn thám như các bản đồ chuyên đề đất đai được phân loại từ việc số hoá dữ liệu bản đồ hiện trạng sử dụng đất có sẵn,... Trong nhiều trường hợp, GIS được sử dụng để quản lý dữ liệu viễn thám, khai thác nguồn dữ liệu này trong tương tác nguồn dữ liệu khác. Nói cách khác, với nguồn dữ liệu thông tin địa lý trong GIS, quá trình phân loại và chiết tách thông tin trong ảnh viễn thám sẽ hiệu quả hơn.

Một số vấn đề khi tích hợp viễn thám và GIS

Trên thực tế, mỗi dữ liệu sẽ có một khuôn dạng khác nhau mà thiếu đi các chuẩn chung thống nhất gây nên mâu thuẫn trong dữ liệu của các đối tượng, điều này là nguyên nhân chính dẫn đến khó khăn trong quá trình tích hợp hai nguồn dữ liệu này. Tuy nhiên, nếu nắm được cốt lõi của vấn đề thì sẽ có các giải pháp hiệu quả giúp cho việc xử lý thông tin dễ dàng và chính xác.

Thiếu chuẩn thống nhất

Dữ liệu viễn thám hay dữ liệu GIS thường được phân phối bởi các công ty làm về dữ liệu không gian. Do đó, mỗi nhà cung cấp sẽ có một kiểu lưu trữ dữ liệu khác nhau để thể hiện tính độc quyền của các công ty và có rất ít sự hợp tác giữa các công ty trong việc nghiên cứu chuẩn chung. Việc thiếu đi những chuẩn này luôn là rào cản trong quá trình ứng dụng tích hợp viễn thám và GIS, đặc biệt với những vệ tinh mới hiện nay thì các khuôn dạng dữ liệu cũng thay đổi đòi hỏi kỹ thuật cao hơn để nhập dữ liệu vào phần mềm có sẵn xử lý. Vì vậy, rất cần thiết việc đẩy nhanh nghiên cứu tạo ra chuẩn thống nhất giữa các nguồn dữ liệu để phát triển ngành công nghiệp dữ liệu không gian mạnh mẽ hơn.

Mâu thuẫn về độ chính xác, chú giải và tỷ lệ của dữ liệu viễn thám và GIS

Ảnh viễn thám được chụp không có tỷ lệ, ngược lại, dữ liệu GIS lại có tỷ lệ. Do đó, khi tích hợp dữ liệu GIS và viễn thám cần phải xem xét yêu cầu độ chính xác với kết quả đầu ra để lựa chọn dữ liệu đầu vào cho phù hợp. Đơn giản nhất có thể thấy độ phân giải của ảnh ảnh hưởng lớn đến độ chính xác. Phân tích dữ liệu địa lý ở các độ phân giải khác nhau sẽ cho thông tin chi tiết khác nhau và trả về những kết quả khác nhau mặc dù cùng một đối tượng.

Đối với yếu tố chú giải cũng là một vấn đề khó giải quyết khi sử dụng những nguồn dữ liệu có các đối tượng với tính chất và đặc điểm từ những nguồn dữ liệu khác nhau. Hiểu một cách đơn giản, chú giải của hai nguồn dữ liệu khác nhau thường khác nhau. Thông tin chú giải sẽ cho người dùng biết cụ thể nó là cái gì có thể thu được ở độ chính xác bao nhiêu. Nhưng ở một góc độ khác, nếu sử dụng những thông tin này từ ảnh viễn thám thì khó có thể tích hợp vào các lớp dữ liệu trong GIS, vì những thông tin này là thông tin thuộc tính không liên quan trực tiếp đến yếu tố vật lý của sự tương tác giữa sóng điện từ và bề mặt trái đất.

Các giải pháp tích hợp dữ liệu

Như đã phân tích trên, có rất nhiều vấn đề gặp phải khi tích hợp dữ liệu viễn thám và dữ liệu GIS đòi hỏi người sử dụng phải đưa ra các biện pháp giải quyết cho từng trường hợp để kết quả đạt độ chính xác cao. Cho tới nay, chưa có phương pháp nào gọi là tốt nhất nhất để giải quyết tất cả các vấn đề khi tích hợp hai kiểu dữ liệu này vì mỗi phương pháp lại có một ưu nhược điểm khác nhau. Tuy nhiên, hiện nay có 3 kiểu tích hợp điển hình được xem như giải pháp tôí ưu nhất: Giải pháp Logic mờ (Fuzzy logic), giải pháp phân tích phi tham số (non-parametric approach), giải pháp tích hợp dựa vào kinh nghiệm (knowledge-based approach).

Giải pháp logic mờ (Fuzzy logic)

Giải pháp này được phát triển từ lý thuyết tập mờ do Zadeh L.A đưa ra lần đầu tiên năm 1965 (Passino và Yurkovich, 1998) để thực hiện tính toán xấp xỉ thay vì tính toán chính xác. Lý thuyết này giải quyết các bài toán rất gần với tư duy của con người nên được áp dụng rộng rãi trong nhiều lĩnh vực của cuộc sống. Phương pháp này quan tâm đến tính bất định (không thể tính toán được xác suất xảy ra của mỗi kết cục) và các vấn đề được xác định bởi các công thức toán học mô phỏng thông qua thuật toán Fuzzy và dựa trên chức năng thành phần được quy định đến từng tập dữ liệu hoặc từng nguồn thông tin.

Phương pháp này khác với logic truyền thống. Nếu như trong logic truyền thống, một biểu thức trong logic chỉ nhận một trong hai giá trị: Đúng (True - 1) hoặc Sai (False - 0) tức mang tính chính xác tuyệt đối. Thì trong logic mờ mức độ đúng sai của một sự kiện được đánh giá bằng một số thực có giá trị nằm giữa 0 và 1, tuỳ theo mức độ đúng, sai của nó. Logic mờ là một công cụ hữu hiệu trong việc xử lý các kiểu dữ liệu khác nhau nên nó có thể thích hợp khi tích hợp dữ liệu viễn thám và GIS. Đã có rất nhiều nghiên cứu lớn sử dụng thuyết Fuzzy, đặc biệt phải kể đến là nghiên cứu đánh giá ảnh hưởng thay đổi ô nhiễm đất của Metternicht (2001) mà kết quả được phân loại sau khi sử dụng quy tắc Fuzzy này. Nhờ có quy tắc này mà dự báo được biến động có thể xảy ra và các cấp độ ô nhiễm trong từng thời điểm dùng để so sánh biến động được mô hình hoá chính xác. Hệ thống này sau đó được đưa vào GIS và sử dụng để đánh giá độ chính xác của một số lớp thông tin độc lập trong hệ thống. Do vậy, nghiên cứu này đang được sử dụng rộng rãi làm cơ sở cho các bài toán về môi trường, đất đai, khí tượng thuỷ văn.

Bản chất của phương pháp logic mờ là các giá trị chuyển từ phân cấp sang liên tục nên ưu điểm của phương pháp này là mạnh về các mô hình bất định nhưng nhược điểm là khó triển khai cho các bài toán lớn.

Giải pháp phân tích phi tham số (non-parametric approach)

Với mô hình phi tham số luôn sử dụng mạng nơron (Neutral network) để tích hợp dữ liệu vì mạng này thường ko yêu cầu mẫu của dữ liệu nguồn mà có khả năng tích hợp nhiều kiểu dữ liệu đầu vào khác nhau dựa trên mẫu phù hợp nhất. Năm 2002, Teng và Fairbairn đã dùng mạng nơron để nhận dạng các đối tượng trên ảnh vệ tinh có độ phân giải cao và đưa từng đối tượng vào các lớp đã thiết kế trước đó. Các lớp dữ liệu này thuộc hệ thống thông tin địa lý. Ngược lại, là một nghiên cứu bởi Smits và ctv (1999), mạng nơron nhân tạo được sử dụng để chuyển dữ liệu GIS thành dữ liệu raster với cùng độ phân giải dựa trên việc độc lập hoá vị trí khu vực nghiên cứu, kết hợp các thông tin lớp phủ thực vật, hướng dốc và kết cấu các lớp đất.

Ưu điểm của phương pháp này là có thể sử dụng được với nhiều nguồn dữ liệu, các mô hình có thể sử dụng linh hoạt với các cấu trúc dữ liệu. Nhưng nhược điểm là đòi hỏi người dùng phải có kiến thức sâu về nơron vì để thực hiện được là vô cùng phức tạp.

Giải pháp tích hợp dựa vào kinh nghiệm (knowledge-based approach)

Giải pháp tích hợp dựa vào kinh nghiệm thường không thực hiện độc lập mà kết hợp với phương pháp logic mờ. Tuy nhiên, chỉ áp dụng khi bài toán không thể thực hiện bằng giải pháp phân tích phi tham số. Đối với giải pháp này sẽ dựa vào kinh nghiệm để phân loại đối tượng, kết nối các công thức tính toán để có được kết quả đạt độ chính xác cao. Phương pháp này sẽ được biến đổi phù hợp với các cấu trúc dữ liệu và công thức toán học có sẵn. Do đó, nó ứng dụng hiệu quả hơn nhưng lại thiếu đi tính linh hoạt. Nghiên cứu của Gahegan và ctv (2000) là một ví dụ điển hình sử dụng giải pháp tích hợp dữ liệu dựa vào kinh nghiệm để theo dõi chất lượng không khí đô thị và vùng. Trong nghiên cứu này, lớp đối tượng về sử dụng đất được tích hợp vào trong cơ sở dữ liệu và hiện trạng không khí là tiêu chuẩn phục vụ công tác định hướng quy hoạch khu cư trú trong vùng. Kết quả nghiên cứu giúp các nhà quy hoạch có thể đề xuất xây dựng đô thị giảm thiểu tác động của ô nhiễm môi trường.

Một vấn đề xảy ra là tích hợp dữ liệu viễn thám và GIS sẽ trở nên kém hiệu quả nếu thông tin không được thành lập từ các nguồn dữ liệu độc lập. Trong nghiên cứu về kiểm kê rừng ngập nước của Price và ctv (2003) đã chứng minh vấn đề này. Nghiên cứu đã tích hợp hai nguồn dữ liệu trên và sử dụng giải pháp tích hợp dựa vào kinh nghiệm. Lớp thông tin gốc được trích xuất từ dữ liệu ảnh viễn thám thông qua giải đoán ảnh. Kết quả của nghiên cứu cho thấy việc tích hợp hai nguồn dữ liệu không phát huy được ưu điểm bằng việc chỉ sử dụng dữ liệu viễn thám. Do đó, giải pháp tích hợp dựa vào kinh nghiệm nên được áp dụng khi biết rõ nguồn gốc dữ liệu được sử dụng để tích hợp.

Giải pháp tích hợp này với tiêu chí hàng đầu là chú trọng kiến thức và kinh nghiệm để đạt được độ chính xác và hiệu quả cho các ứng dụng, đây cũng là ưu điểm lớn của giải pháp. Nhưng nhược điểm là cần phải sử dụng nhiều quy tắc khác nhau để đạt được kết quả.

Kết luận

Những vấn đề bất đồng dữ liệu là không thể tránh khỏi trong quá trình tích hợp giữa dữ liệu GIS và viễn thám. Nghiên cứu đã chỉ ra ưu, nhược điểm của từng phương pháp, điều này sẽ thuận tiện cho người dùng xem xét trong từng trường hợp cụ thể, yêu cầu độ chính xác với sản phẩm đầu ra cũng như khả năng thực hiện của người sử dụng mà lựa chọn phương pháp xử lý dữ liệu sao cho quá trình tích hợp trở nên dễ dàng và có độ tin cậy cao.

Tài liệu tham khảo

1. Gahegan, M.N (1996). Specifying the transformations within and between geographic data models;

2. Passino K, Yurkovich S (1998). Fuzzy control, Addison Wesleyt;

3. Smith, G.M, and Fuller R.M (2001). An intergrated approach to land cover classification: An example in the island of Jersey. International Journal of Remote Sensing;

4. Teng, CH, and Fairbairn, D. (2000). Compareing expert system and neural Fuzzy systems for object recognition in map dataset resivison. International Journal of Remote Sensing;

5. Volker Walter (1998). Automatic classification of remote sensing data for GIS database revision. ISPRS Commission IV Symposium on GIS – Between Visions and Applications, Stuttgart, Germany.

VŨ NGỌC PHƯỢNG

Khoa Công trình, Trường Đại học Giao thông vận tải