Tổng thuật nghiên cứu ứng dụng học sâu trong phân loại lớp phủ bề mặt từ dữ liệu SAR và quang học đa nguồn

Nghiên cứu “Land Use and Land Cover Classification with Deep Learning-Based Fusion of SAR and Optical Data” của Ayesha Irfan, Yu Li, Xinhua E và Guangmin Sun, công bố trên tạp chí Remote Sensing năm 2025, tập trung vào bài toán phân loại sử dụng đất/lớp phủ bề mặt (Land Use/Land Cover – LULC) bằng phương pháp hợp nhất dữ liệu ảnh radar khẩu độ tổng hợp (SAR) và ảnh quang học dựa trên học sâu. Đây là hướng nghiên cứu có ý nghĩa lớn trong bối cảnh nhu cầu giám sát tài nguyên, môi trường và biến động sử dụng đất ngày càng gia tăng, đặc biệt đối với các quốc gia thường xuyên chịu tác động của mây phủ và điều kiện thời tiết nhiệt đới như Việt Nam.

Theo nhóm tác giả, ảnh quang học và ảnh SAR mang những đặc tính bổ trợ lẫn nhau. Dữ liệu quang học cung cấp thông tin phổ phong phú, thuận lợi cho nhận dạng thực vật, mặt nước và khu đô thị; trong khi dữ liệu SAR có khả năng quan sát mọi điều kiện thời tiết, hoạt động cả ngày lẫn đêm, đồng thời phản ánh tốt cấu trúc hình học và đặc tính tán xạ của bề mặt. Tuy nhiên, sự khác biệt về cơ chế tạo ảnh giữa hai loại dữ liệu khiến việc tích hợp hiệu quả chúng trở thành một thách thức lớn trong viễn thám hiện đại.

Nghiên cứu sử dụng bộ dữ liệu SEN12MS – một tập dữ liệu quy mô lớn gồm ảnh Sentinel-1 SAR và Sentinel-2 quang học được đồng đăng ký toàn cầu, với độ phân giải không gian 10 m và kích thước mỗi ảnh 256 × 256 pixel. Bộ dữ liệu bao gồm nhiều lớp phủ bề mặt như rừng, cây trồng, mặt nước, đất trống, khu xây dựng và savanna, cho phép đánh giá khả năng tổng quát hóa của mô hình trong các điều kiện địa lý đa dạng. Từ hơn 180.000 mẫu ảnh, nhóm nghiên cứu lựa chọn ngẫu nhiên 12.000 mẫu để huấn luyện và kiểm thử mô hình học sâu.

Điểm nổi bật của nghiên cứu là việc đề xuất hai chiến lược hợp nhất dữ liệu gồm Early Fusion và Late Fusion. Với Early Fusion, toàn bộ 15 kênh dữ liệu từ Sentinel-1 và Sentinel-2 được ghép ngay từ đầu thành một tensor thống nhất trước khi đưa vào mạng CNN để trích xuất đặc trưng. Trong khi đó, Late Fusion xử lý riêng từng nguồn dữ liệu qua các nhánh đặc trưng độc lập, sau đó mới hợp nhất ở giai đoạn cuối của mạng. Cả hai mô hình đều sử dụng kiến trúc CNN nhiều tầng với cơ chế chuẩn hóa batch normalization, pooling và dropout nhằm giảm hiện tượng quá khớp và tăng khả năng khái quát hóa.

Kết quả thực nghiệm cho thấy chiến lược Early Fusion đạt hiệu quả vượt trội so với Late Fusion. Độ chính xác tổng thể của Early Fusion đạt 88,12% với F1-score 86,53%, trong khi Late Fusion chỉ đạt lần lượt 83,96% và 81,87%. Đặc biệt, lớp mặt nước cho kết quả phân loại rất cao với F1-score trên 97%, phản ánh ưu thế rõ rệt của việc kết hợp thông tin phổ từ ảnh quang học với cấu trúc tán xạ từ SAR. Nhóm tác giả cho rằng Early Fusion hiệu quả hơn do mô hình có thể học được mối tương quan liên phương thức ngay từ giai đoạn đầu, từ đó giảm nhiễu speckle của SAR và tận dụng đồng thời các đặc trưng phổ – kết cấu.

Nghiên cứu cũng so sánh mô hình đề xuất với các mạng CNN phổ biến như ResNet, GoogleNet và VGGNet. Kết quả cho thấy các mô hình truyền thống chỉ đạt độ chính xác khoảng 53–72% tùy loại dữ liệu đầu vào, thấp hơn đáng kể so với mô hình fusion đề xuất. Điều này chứng minh rằng việc tích hợp đa nguồn dữ liệu viễn thám là xu hướng tất yếu nhằm nâng cao chất lượng phân loại lớp phủ bề mặt trong bối cảnh dữ liệu vệ tinh ngày càng phong phú.

Đối với Việt Nam, nghiên cứu này có tiềm năng ứng dụng rất lớn trong nhiều lĩnh vực quản lý tài nguyên và môi trường. Với điều kiện khí hậu nhiệt đới gió mùa, tỷ lệ mây phủ cao quanh năm khiến ảnh quang học thường bị hạn chế khả năng khai thác, đặc biệt trong mùa mưa ở miền Bắc và Tây Nguyên. Việc kết hợp dữ liệu SAR Sentinel-1 với ảnh quang học Sentinel-2 có thể khắc phục đáng kể nhược điểm này, bảo đảm tính liên tục của chuỗi dữ liệu phục vụ giám sát lãnh thổ. Đây là giải pháp đặc biệt hữu ích cho công tác cập nhật hiện trạng sử dụng đất, giám sát chuyển đổi mục đích sử dụng đất và theo dõi biến động rừng.

Trong lĩnh vực nông nghiệp, mô hình fusion SAR–quang học có thể hỗ trợ phân loại cây trồng, giám sát mùa vụ và đánh giá thiệt hại do thiên tai. Các vùng đồng bằng như Đồng bằng sông Hồng và Đồng bằng sông Cửu Long thường xuyên chịu ảnh hưởng của ngập lụt, xâm nhập mặn và mây phủ kéo dài, khiến dữ liệu quang học đơn nguồn khó đáp ứng yêu cầu theo dõi liên tục. Dữ liệu SAR với khả năng xuyên mây sẽ cung cấp thông tin bổ sung quan trọng về độ ẩm đất, cấu trúc cây trồng và tình trạng ngập nước.

Trong quản lý đô thị, mô hình này có thể ứng dụng để phát hiện mở rộng khu dân cư, giám sát đô thị hóa và cập nhật cơ sở dữ liệu nền địa lý. Dữ liệu SAR đặc biệt hữu ích trong nhận dạng cấu trúc xây dựng nhờ khả năng phản xạ mạnh từ các bề mặt nhân tạo, trong khi ảnh quang học hỗ trợ nhận diện đặc trưng vật liệu và không gian xanh đô thị. Việc kết hợp hai nguồn dữ liệu giúp nâng cao độ chính xác trong phân loại khu xây dựng tại các đô thị lớn như Hà Nội, Thành phố Hồ Chí Minh và các khu công nghiệp ven biển.

Ngoài ra, nghiên cứu còn mở ra khả năng ứng dụng trong giám sát rừng và tài nguyên thiên nhiên. Các khu vực miền núi Tây Bắc, Trường Sơn hay Tây Nguyên thường có địa hình phức tạp và thời tiết nhiều mây, gây khó khăn cho theo dõi diễn biến rừng bằng ảnh quang học. Mô hình fusion có thể hỗ trợ phát hiện suy giảm rừng, cháy rừng và biến động lớp phủ với độ tin cậy cao hơn. Đây là cơ sở quan trọng để xây dựng các hệ thống giám sát tài nguyên quốc gia theo hướng tự động hóa bằng trí tuệ nhân tạo.

Nhìn chung, nghiên cứu của Irfan và cộng sự đã chứng minh hiệu quả rõ rệt của học sâu đa nguồn trong phân loại lớp phủ bề mặt từ dữ liệu SAR và quang học. Việc kết hợp dữ liệu Sentinel-1 và Sentinel-2 thông qua chiến lược Early Fusion không chỉ nâng cao độ chính xác phân loại mà còn tăng tính ổn định trong các điều kiện quan sát phức tạp. Đối với Việt Nam, hướng tiếp cận này có thể trở thành nền tảng công nghệ quan trọng cho xây dựng hệ thống giám sát tài nguyên, môi trường và biến động sử dụng đất quy mô quốc gia trong giai đoạn chuyển đổi số ngành viễn thám và địa không gian hiện nay.

Nguồn bài báo:
Ayesha Irfan, Yu Li, Xinhua E, Guangmin Sun (2025), “Land Use and Land Cover Classification with Deep Learning-Based Fusion of SAR and Optical Data”, Remote Sensing, 17(7), 1298. https://doi.org/10.3390/rs17071298

Tổng thuật nghiên cứu ứng dụng học sâu trong phân loại lớp phủ bề mặt từ dữ liệu SAR và quang học đa nguồn

Giám sát hư hỏng đê điều bằng ảnh viễn thám UAV và mô hình học sâu thời gian thực

Ứng dụng ảnh siêu phổ trong nghiên cứu đô thị: Xu thế phát triển và triển vọng triển khai tại Việt Nam

Ứng dụng mô hình StyleGAN2 điều khiển góc nhìn trong sinh ảnh SAR và nhận dạng mục tiêu: Tiềm năng cho bài toán viễn thám radar tại Việt Nam