Sign In

ClimSat – Mô hình khuếch tán tự mã hóa cho biên tập ảnh vệ tinh theo điều kiện khí hậu

17:46 19/05/2026

Chọn cỡ chữ A a  

Sự phát triển nhanh của trí tuệ nhân tạo tạo sinh (Generative AI) đang mở ra nhiều hướng tiếp cận mới trong lĩnh vực viễn thám. Nếu trước đây ảnh vệ tinh chủ yếu được sử dụng để quan sát hiện trạng bề mặt Trái Đất, thì các mô hình học sâu hiện đại đã cho phép mô phỏng và dự báo sự thay đổi của cảnh quan dưới các điều kiện môi trường khác nhau. Một trong những nghiên cứu đáng chú ý gần đây là mô hình ClimSat, được công bố trên tạp chí Science of Remote Sensing năm 2025.

Nghiên cứu do Johannes Leonhardt, Juergen Gall và Ribana Roscher thực hiện đã đề xuất một mô hình “diffusion autoencoder” có khả năng chỉnh sửa ảnh vệ tinh theo các điều kiện khí hậu giả định, từ đó mô phỏng tác động của biến đổi khí hậu lên cảnh quan tự nhiên. 

Ý tưởng và mục tiêu của nghiên cứu

Các điều kiện khí hậu như nhiệt độ, lượng mưa hay tốc độ gió có ảnh hưởng rất lớn tới sự phân bố lớp phủ bề mặt, mật độ thực vật và trạng thái hệ sinh thái. Tuy nhiên, các phương pháp viễn thám truyền thống chủ yếu chỉ phản ánh hiện trạng quan sát được, chưa thể mô phỏng trực tiếp một khu vực sẽ thay đổi như thế nào dưới các kịch bản khí hậu tương lai. 

Để giải quyết bài toán này, nhóm tác giả xây dựng mô hình ClimSat nhằm tạo ra các ảnh vệ tinh “đã chỉnh sửa khí hậu”, tức là giữ nguyên nội dung cảnh quan chính nhưng thay đổi đặc trưng bề mặt theo điều kiện khí hậu mục tiêu. Ví dụ, một khu vực rừng ở Thụy Điển có thể được mô phỏng dưới điều kiện khí hậu nóng và khô hơn tương tự miền nam Hy Lạp. 

Điểm đặc biệt của ClimSat là khả năng “tách biệt” ảnh hưởng của khí hậu khỏi nội dung ảnh. Điều này giúp mô hình vừa duy trì được cấu trúc cảnh quan ban đầu, vừa tạo ra các biến đổi hợp lý về màu sắc, mật độ thảm thực vật hay trạng thái đất đai dưới tác động khí hậu mới. 

Kiến trúc mô hình ClimSat

ClimSat được xây dựng dựa trên mô hình Diffusion Autoencoder, một biến thể của mô hình khuếch tán (diffusion model) đang rất phổ biến trong lĩnh vực tạo sinh ảnh. Khác với GAN truyền thống, diffusion model tạo ảnh bằng cách thêm nhiễu dần vào ảnh gốc rồi học cách khử nhiễu để tái tạo ảnh mới. Phương pháp này cho phép sinh ảnh có chất lượng cao và ổn định hơn. 

Trong ClimSat, quá trình hoạt động gồm hai bước chính:

  1. Mã hóa (encoding) ảnh vệ tinh gốc cùng thông tin khí hậu hiện tại và dữ liệu lớp phủ bề mặt; 

  2. Giải mã (decoding) để tạo ra ảnh mới theo điều kiện khí hậu mục tiêu. 

Mô hình sử dụng:

  • Ảnh Sentinel-2 độ phân giải 10 m; 
  • Dữ liệu khí hậu CMIP6; 
  • Bản đồ lớp phủ ESA WorldCover. 

Ngoài ra, nghiên cứu còn áp dụng kỹ thuật Multi-Conditional Batch Normalization (MCBN) nhằm tích hợp đồng thời thông tin khí hậu và lớp phủ bề mặt vào quá trình sinh ảnh. Nhờ đó, mô hình có thể duy trì cấu trúc lớp phủ trong khi điều chỉnh biểu hiện khí hậu trên ảnh. 

Dữ liệu và thí nghiệm

Bộ dữ liệu nghiên cứu gồm hơn 342.000 mẫu dữ liệu trên phạm vi châu Âu. Mỗi mẫu bao gồm:

  • ảnh vệ tinh Sentinel-2 đa phổ; 
  • thông tin khí hậu; 
  • bản đồ lớp phủ đất ESA WorldCover.  

Các tác giả chia dữ liệu thành tập huấn luyện, kiểm tra và xác thực theo từng quốc gia nhằm đánh giá khả năng tổng quát hóa của mô hình. 

Kết quả cho thấy ClimSat vượt trội hơn các mô hình GAN và autoencoder truyền thống ở cả hai tiêu chí:

  • chất lượng ảnh sinh ra; 
  • mức độ trung thành với điều kiện khí hậu và nội dung ảnh gốc. 

Theo bảng đánh giá trong nghiên cứu, ClimSat đạt chỉ số FID và KID gần với ảnh thật hơn đáng kể so với các mô hình đối chứng. Đồng thời, ảnh tạo ra giữ được cấu trúc lớp phủ đất tốt hơn nhiều so với phiên bản chỉ sử dụng điều kiện khí hậu mà không có dữ liệu lớp phủ. 

Ứng dụng trong tăng cường dữ liệu viễn thám

Một ứng dụng quan trọng của ClimSat là tăng cường dữ liệu (data augmentation) cho các bài toán phân loại lớp phủ đất. Trong thực tế, nhiều bộ dữ liệu huấn luyện chỉ tập trung ở một số quốc gia hoặc vùng địa lý nhất định, khiến mô hình học máy khó tổng quát hóa khi áp dụng sang khu vực khác.

Nhóm nghiên cứu đã sử dụng ClimSat để tạo thêm các phiên bản ảnh dưới điều kiện khí hậu khác nhau, qua đó mở rộng tính đa dạng của dữ liệu huấn luyện. Kết quả cho thấy độ chính xác phân loại lớp phủ tăng đáng kể tại các quốc gia như Phần Lan, Romania hay Ý. 

Điều này cho thấy mô hình không chỉ có ý nghĩa nghiên cứu mà còn có tiềm năng ứng dụng thực tế trong xây dựng bộ dữ liệu viễn thám đa dạng, đặc biệt đối với các khu vực thiếu dữ liệu tham chiếu.

Mô phỏng biến đổi khí hậu bằng ảnh vệ tinh

Ứng dụng nổi bật nhất của ClimSat là trực quan hóa tác động của biến đổi khí hậu. Nghiên cứu đã mô phỏng ảnh vệ tinh đến năm 2100 cho hai khu vực bảo tồn tại Phần Lan và Ý theo hai kịch bản phát thải SSP245 và SSP585 của CMIP6. 

Kết quả cho thấy:

  • tại Phần Lan, rừng có xu hướng thưa hơn và thay đổi trạng thái sinh trưởng; 
  • tại Ý, cảnh quan trở nên khô hạn hơn do nhiệt độ tăng và lượng mưa giảm. 

Nghiên cứu cũng tính toán chuỗi thời gian NDVI từ các ảnh sinh ra để đánh giá sức khỏe thảm thực vật trong tương lai. Các chỉ số này cho thấy sự suy giảm mạnh của thảm thực vật dưới kịch bản phát thải cao SSP585. 

Đây là hướng tiếp cận rất có giá trị trong truyền thông biến đổi khí hậu, bởi hình ảnh trực quan thường giúp người dân và nhà quản lý dễ hình dung hơn so với các biểu đồ khí tượng truyền thống.

Đánh giá và triển vọng

Nghiên cứu ClimSat cho thấy tiềm năng lớn của các mô hình diffusion trong lĩnh vực viễn thám. So với GAN, diffusion model tạo ảnh ổn định hơn, ít nhiễu và có khả năng kiểm soát điều kiện đầu vào tốt hơn. Đồng thời, việc kết hợp dữ liệu khí hậu với lớp phủ đất đã giúp mô hình duy trì được tính thực tế của ảnh sinh ra. 

Tuy nhiên, nhóm tác giả cũng thừa nhận một số hạn chế:

  • thời gian suy luận còn chậm do phải thực hiện nhiều bước khuếch tán; 
  • chưa mô phỏng được thay đổi lớp phủ đất dài hạn; 
  • các phân tích định lượng từ ảnh sinh ra vẫn cần được kiểm chứng thêm bằng mô hình vật lý khí hậu. 

Dù vậy, ClimSat vẫn được xem là một bước tiến quan trọng trong xu hướng kết hợp trí tuệ nhân tạo tạo sinh với viễn thám và khoa học khí hậu. Trong tương lai, các mô hình tương tự có thể hỗ trợ mạnh mẽ cho dự báo môi trường, đánh giá rủi ro khí hậu và xây dựng các hệ thống hỗ trợ ra quyết định trong quản lý tài nguyên thiên nhiên.

Tài liệu tham khảo

Leonhardt, J., Gall, J., & Roscher, R. (2025). ClimSat – A diffusion autoencoder model for climate-conditional satellite image editing. Science of Remote Sensing, 11, 100235. Elsevier. https://doi.org/10.1016/j.srs.2025.100235

Văn phòng Cục Viễn thám quốc gia

Ý kiến

Nâng cao năng lực ứng dụng dữ liệu radar vệ tinh SAR: Cục Viễn thám quốc gia tổ chức khóa đào tạo về chòm vệ tinh cosmo-skymed

Nâng cao năng lực ứng dụng dữ liệu radar vệ tinh SAR: Cục Viễn thám quốc gia tổ chức khóa đào tạo về chòm vệ tinh cosmo-skymed

Trong bối cảnh nhu cầu khai thác dữ liệu viễn thám phục vụ quản lý nhà nước, phát triển kinh tế - xã hội, bảo đảm quốc phòng, an ninh và ứng phó thiên tai ngày càng gia tăng, công nghệ radar khẩu độ tổng hợp (Synthetic Aperture Radar - SAR) đang trở thành một trong những công nghệ quan sát Trái đất có vai trò đặc biệt quan trọng. Khác với các hệ thống vệ tinh quang học phụ thuộc vào điều kiện thời tiết và ánh sáng mặt trời, vệ tinh SAR có khả năng thu nhận dữ liệu cả ngày lẫn đêm, xuyên qua mây, mưa và nhiều điều kiện thời tiết bất lợi, qua đó bảo đảm tính liên tục của nguồn dữ liệu phục vụ giám sát, theo dõi và quản lý lãnh thổ.
Giám sát hư hỏng đê điều bằng ảnh viễn thám UAV và mô hình học sâu thời gian thực

Giám sát hư hỏng đê điều bằng ảnh viễn thám UAV và mô hình học sâu thời gian thực

Sự gia tăng của các hiện tượng thời tiết cực đoan, lũ lớn và biến đổi khí hậu đang đặt ra yêu cầu cấp thiết đối với công tác giám sát an toàn đê điều và hạ tầng thủy lợi. Trong bối cảnh đó, công nghệ viễn thám UAV kết hợp trí tuệ nhân tạo (AI) đang trở thành hướng tiếp cận quan trọng nhằm tự động hóa quá trình kiểm tra, phát hiện sớm các hư hỏng kết cấu. Nghiên cứu của Bangbin Wu, Bo Chen, Xinxin Jiang và Zhi Liu công bố trên tạp chí Scientific Reports năm 2025 đã đề xuất một mô hình học sâu nhẹ hóa dựa trên kiến trúc U-Net nhằm phát hiện khuyết tật bề mặt đê bằng ảnh UAV theo thời gian thực.
Tổng thuật nghiên cứu ứng dụng học sâu trong phân loại lớp phủ bề mặt từ dữ liệu SAR và quang học đa nguồn

Tổng thuật nghiên cứu ứng dụng học sâu trong phân loại lớp phủ bề mặt từ dữ liệu SAR và quang học đa nguồn

Nghiên cứu “Land Use and Land Cover Classification with Deep Learning-Based Fusion of SAR and Optical Data” của Ayesha Irfan, Yu Li, Xinhua E và Guangmin Sun, công bố trên tạp chí Remote Sensing năm 2025, tập trung vào bài toán phân loại sử dụng đất/lớp phủ bề mặt (Land Use/Land Cover – LULC) bằng phương pháp hợp nhất dữ liệu ảnh radar khẩu độ tổng hợp (SAR) và ảnh quang học dựa trên học sâu. Đây là hướng nghiên cứu có ý nghĩa lớn trong bối cảnh nhu cầu giám sát tài nguyên, môi trường và biến động sử dụng đất ngày càng gia tăng, đặc biệt đối với các quốc gia thường xuyên chịu tác động của mây phủ và điều kiện thời tiết nhiệt đới như Việt Nam.