Sign In

Các ứng dụng số mở khóa tiềm năng của mô hình nền AI viễn thám để giám sát môi trường quy mô lớn

13:55 11/08/2025

Chọn cỡ chữ A a  

Các mô hình nền tảng AI cảm biến từ xa, vốn là những mô hình lớn được huấn luyện sẵn và có thể thích ứng với nhiều nhiệm vụ khác nhau, đã giúp giảm đáng kể nguồn lực cần thiết để thực hiện giám sát môi trường — một nhiệm vụ trọng tâm trong phát triển các công nghệ hệ sinh thái. Tuy nhiên, những thách thức riêng biệt liên quan đến dữ liệu cảm biến từ xa đòi hỏi phải phát triển các ứng dụng số để khai thác hiệu quả các mô hình này. Trong bài viết này, chúng tôi thảo luận về những ví dụ ban đầu của các ứng dụng số lấy người dùng làm trung tâm nhằm tăng cường tác động của các mô hình nền tảng AI cảm biến từ xa. Bằng cách đơn giản hóa quá trình huấn luyện và suy luận mô hình, các ứng dụng này mở rộng khả năng thực hiện các nhiệm vụ học máy truyền thống đến nhiều nhóm người dùng khác nhau, cuối cùng mang lại dữ liệu được điều chỉnh theo địa phương, chính xác và thực tiễn hơn.

Các mô hình nền tảng AI gần đây đã nổi lên như những công cụ mạnh mẽ trong việc phân tích các bộ dữ liệu môi trường quy mô lớn, đặc biệt là trong lĩnh vực cảm biến từ xa (Zhu et al., 2024Zhang et al., 2024Tao et al., 2023). Những mô hình nền tảng này được huấn luyện sẵn trên các bộ dữ liệu lớn, thường không gán nhãn, giúp tinh chỉnh hiệu quả và chính xác cho nhiều nhiệm vụ hạ nguồn khác nhau (Bommasani et al., 2021Han et al., 2022). Ví dụ, một mô hình nền tảng cảm biến từ xa có thể được huấn luyện trước thông qua học tự giám sát trên một kho dữ liệu lớn gồm ảnh vệ tinh không gán nhãn, qua đó học được các biểu diễn tổng quát nắm bắt được các mẫu đặc trưng trong phân bố dữ liệu huấn luyện (Klemmer et al., 2023Wang D. et al., 2024). Người dùng sau đó có thể tinh chỉnh mô hình này cho một nhiệm vụ cụ thể, chẳng hạn như giám sát quá trình phục hồi của một loại sinh cảnh nhất định. Nhờ quá trình huấn luyện trước hiệu quả, mô hình nền tảng chỉ cần một lượng dữ liệu huấn luyện chuyên biệt tương đối nhỏ để đạt được hiệu suất cao (Allen et al., 2023Một lợi thế khác thường bị đánh giá thấp của mô hình nền tảng là khả năng đơn giản hóa đáng kể các yêu cầu kỹ thuật và công việc kỹ thuật cần thiết để xây dựng và triển khai các công nghệ tiên tiến  (Bommasani et al., 2021).

Các mô hình nền tảng cho dữ liệu cảm biến từ xa đang cho thấy nhiều tiềm năng trong công nghệ hệ sinh thái, nơi việc cảm nhận và giám sát hệ sinh thái đóng vai trò then chốt. Công nghệ hệ sinh thái (ecotech) là một lĩnh vực mới nổi, hướng đến việc hệ thống hóa và tích hợp các can thiệp công nghệ lấy cảm hứng từ hệ tự nhiên nhằm thúc đẩy khả năng thích ứng với biến đổi khí hậu và bảo tồn đa dạng sinh học. Tất cả các công nghệ hệ sinh thái dựa trên địa điểm đều đòi hỏi dữ liệu giám sát cập nhật và mang tính bối cảnh để phục vụ cho (1) nghiên cứu khoa học cơ bản trong giai đoạn phát triển công nghệ ban đầu (2) lựa chọn địa điểm và lập kế hoạch dự án, và (3) giám sát, báo cáo và kiểm chứng liên tục. Cụ thể, các hoạt động như tái hoang dã, phục hồi cảnh quan, kỹ thuật cảnh quan, trồng rừng, nông nghiệp tái sinh, và ở khu vực ven biển là việc phục hồi các vùng đất ngập nước, hệ sinh thái đồi cát, rừng ngập mặn và cỏ biển - đều có thể được nghiên cứu hiệu quả thông qua công nghệ cảm biến từ xa. Do sự đa dạng và tính đặc thù theo vị trí của các can thiệp dự kiến, các phương pháp phân tích mới là cần thiết - phải chính xác hơn và thích nghi tốt hơn với điều kiện địa phương so với các khảo sát sử dụng đất - lớp phủ đất truyền thống. Các mô hình nền tảng AI cảm biến từ xa mang đến một hướng đi đầy hứa hẹn cho việc phát triển những kỹ thuật phân tích tiên tiến này.

Hiện nay, các nghiên cứu về mô hình nền tảng chủ yếu tập trung vào phát triển bản thân các mô hình (Cong et al., 2022Jakubik et al., 2023Tseng et al., 2023Szwarcman et al., 2025), thường đi kèm với các bộ dữ liệu huấn luyện quy mô lớn (Bastani et al., 2023Wang et al., 2023), à vào việc đánh giá hiệu suất mô hình trên các tập nhiệm vụ ngày càng đa dạng (Lacoste et al., 2021Lacoste et al., 2023Marsocci et al., 2024). Việc xuất hiện các bộ tiêu chuẩn đánh giá liên quan đến khí hậu, chẳng hạn như dữ liệu về rừng và vết cháy rừng, cùng với các sáng kiến như dự án Foundation Models for Climate and Society do ESA tài trợ - tập trung vào việc lập bản đồ băng, hạn hán và vùng ngập lụt - cho thấy một xu hướng chuyển dịch sang nghiên cứu ứng dụng thực tiễn.Chúng tôi sẽ trình bày một số trường hợp sử dụng thử nghiệm trong thế giới thực của các mô hình nền tảng dưới đây.

Chúng tôi cho rằng các ứng dụng số hướng mục tiêu có thể mở khóa tiềm năng của các mô hình nền tảng trong ra quyết định liên quan đến môi trường. Dựa trên các đặc trưng tiên tiến của mô hình nền tảng được hình thành từ quá trình huấn luyện trước quy mô lớn, một ứng dụng số có thể tự động hóa các quy trình học máy phức tạp phía sau và đơn giản hóa đáng kể việc huấn luyện và suy luận mô hình cho các tác vụ hạ nguồn. Nhờ đó, các ứng dụng số có thể giúp các nhà khoa học môi trường, nhà hoạch định chính sách và các bên liên quan khác dễ dàng hơn trong việc tương tác với những mô hình mạnh mẽ này — đồng thời chúng cũng có thể trở thành thành phần thiết yếu trong các công nghệ hệ sinh thái của tương lai.

Một ví dụ tương tự là GPT, một mô hình nền tảng dành cho văn bản (OpenAI, 2023). GPT là một mô hình ngôn ngữ lớn tiên tiến, nhưng chỉ thực sự thu hút sự chú ý rộng rãi sau khi ChatGPT được phát hành - một giao diện chatbot đã được tinh chỉnh, có thể truy cập dễ dàng qua trình duyệt web hoặc ứng dụng trên điện thoại thông minh. Tính dễ sử dụng của ChatGPT đã thúc đẩy mức độ tiếp nhận kỷ lục, khiến nó trở thành ứng dụng kỹ thuật số phát triển nhanh nhất trong lịch sử, đạt 100 triệu người dùng trong thời gian ngắn chưa từng có (Hu, 2023).

Điều quan trọng là các ứng dụng số cho mô hình nền tảng AI cảm biến từ xa mang lại giá trị vượt xa việc chỉ đơn thuần trực quan hóa đầu ra của mô hình. Như chúng tôi sẽ trình bày dưới đây, những ứng dụng này có thể đơn giản hóa đáng kể quy trình tinh chỉnh mô hình nền tảng. Khả năng này mở ra cơ hội cho các phương pháp “con người trong vòng lặp” (human-in-the-loop) hoặc học chủ động (active learning) để tinh chỉnh mô hình một cách nhanh chóng - từ đó tăng tốc quá trình phát triển các mô hình chính xác và tạo ra các bộ dữ liệu chất lượng cao.

Trong bài viết này, chúng tôi chia sẻ góc nhìn của mình dựa trên quá trình phát triển một ứng dụng số ban đầu cho giám sát môi trường, ứng dụng các mô hình nền tảng cảm biến từ xa. Dạng ứng dụng này không chỉ là một đổi mới về mặt kỹ thuật, mà còn là một ví dụ cụ thể của công nghệ hệ sinh thái (ecotech) - cho thấy việc giám sát và quản lý sinh thái đang chuyển mình thông qua công nghệ. Trước hết, chúng tôi trình bày các cân nhắc thiết kế kỹ thuật chung khi phát triển những ứng dụng kiểu này, sau đó là một số nguyên mẫu hiện có. Những ví dụ này mở ra những khả năng đầy hứa hẹn trong việc khai thác các bộ dữ liệu cảm biến từ xa chất lượng cao, và chúng tôi hy vọng có thể định hướng các hợp tác hiệu quả giữa nhà phát triển ứng dụng và nhà nghiên cứu khoa học.

2. Những cân nhắc chính khi phát triển giao diện người dùng cho mô hình nền tảng cảm biến từ xa

Trong phần này, chúng tôi thảo luận một số cân nhắc quan trọng khi xây dựng các ứng dụng số sử dụng mô hình nền tảng AI cảm biến từ xa. Trong số các yếu tố này, bốn yếu tố nổi bật trong công việc của chúng tôi gồm: (1) lựa chọn nhiệm vụ, (2) chiến lược gợi ý, (3) hỗ trợ cho học máy, và (4) tích hợp với các công cụ khác, bao gồm cả các hình thức AI khác.

2.1. Nhiệm vụ nào được hỗ trợ?
Nhiều mô hình nền tảng cảm biến từ xa hiện đại được huấn luyện theo hướng đa nhiệm, sao cho chúng có thể hỗ trợ một số dạng nhiệm vụ như phân loại, phân đoạn, hồi quy, phát hiện đối tượng và phát hiện thay đổi (Lu et al., 2024). Ví dụ, mô hình nền tảng Skysense đã cho thấy hiệu suất tốt trên 16 bộ dữ liệu chuẩn, bao gồm bảy loại nhiệm vụ khác nhau (Guo et al., 2024).

Việc phát triển một ứng dụng số cho giám sát môi trường đòi hỏi phải hiểu rõ nhu cầu của người dùng và liên kết phù hợp các nhu cầu này với các nhiệm vụ tương ứng. Ví dụ, một người dùng quan tâm đến việc theo dõi nạn phá rừng có thể muốn tạo cảnh báo cho các tuyến đường khai thác gỗ mới trong một khu vực nhất định (phát hiện thay đổi và phân loại). Hoặc, người dùng đó có thể muốn định lượng diện tích bị phá rừng (phân đoạn).

2.2. Chiến lược gợi ý là gì?

 Trong khi các mô hình học máy truyền thống trong cảm biến từ xa có thể yêu cầu đầu vào là một bộ dữ liệu đã được xử lý với các nhãn xác định và một ảnh cảm biến đơn lẻ hoặc chuỗi thời gian theo điểm ảnh, thì người dùng có thể tương tác với một mô hình nền tảng đã được huấn luyện sẵn theo cách linh hoạt và tinh tế hơn. Nhiều chiến lược gợi ý khác nhau thường có thể được tích hợp trực tiếp vào giao diện người dùng được xây dựng dựa trên các mô hình nền tảng này.

2.2.1. Gợi ý bằng ngôn ngữ tự nhiên

Với sự phổ biến của ChatGPT và các mô hình ngôn ngữ lớn, một hướng phát triển tự nhiên là gợi ý bằng ngôn ngữ đối với các mô hình nền tảng cảm biến từ xa. Một số “mô hình thị giác-ngôn ngữ” (VLMs) đã được phát triển, đặc biệt hướng đến chế độ tương tác này với dữ liệu cảm biến từ xa (Hu et al., 2023Irvin et al., 2024Kuckreja et al., 2024Liu et al., 2024). Những mô hình này cho phép người dùng đặt câu hỏi bằng văn bản như, “Khu vực này có sự phát triển hạ tầng ở đâu?” Mô hình nhận câu hỏi văn bản và ảnh cảm biến từ xa làm đầu vào và cung cấp một chuỗi văn bản làm đầu ra. Gợi ý bằng ngôn ngữ tự nhiên đơn giản hóa sự tương tác với các mô hình nền tảng cảm biến từ xa. Tuy nhiên, trong nhiều trường hợp, gợi ý bằng ngôn ngữ tự nhiên có thể bị hạn chế. Ví dụ, việc huấn luyện các VLM yêu cầu các bộ dữ liệu địa không gian lớn liên kết hình ảnh với nhãn văn bản (Irvin et al., 2024). Mặc dù đã có nhiều tiến bộ đáng kể trong việc tạo ra các bộ dữ liệu huấn luyện này, chúng thường dựa vào các nguồn thiên lệch về mặt địa lý hoặc không đầy đủ như OpenStreetMap (Li et al., 2020).

2.2.2. Gợi ý dựa trên vị trí

Một phương án thay thế cho gợi ý bằng ngôn ngữ tự nhiên đối với các mô hình nền tảng là gợi ý dựa trên vị trí, trong đó người dùng cung cấp một điểm, hộp giới hạn (bounding box), hoặc tham chiếu địa lý khác làm đầu vào cho mô hình. Mô hình Segment Anything của Meta (SAM) đã thu hút được sự chú ý lớn khi được phát hành vào năm 2023, một phần là nhờ tính dễ sử dụng của chế độ gợi ý tương tác bằng điểm hoặc hộp giới hạn.Khả năng này đã được cộng đồng địa không gian đón nhận, với các dự án như samgeo - một bộ công cụ địa không gian cho SAM bao gồm giao diện người dùng dựa trên bản đồ sử dụng notebook Python (Wu and Osco, 2023).

2.3. Việc huấn luyện và suy luận mô hình được tích hợp như thế nào?
Để hữu ích cho các ứng dụng phía sau, các mô hình nền tảng thường được tinh chỉnh với dữ liệu huấn luyện chuyên biệt cho ứng dụng. Tuy nhiên, điều này không phải lúc nào cũng cần thiết. Ví dụ, người dùng ChatGPT có thể khai thác giá trị từ việc trò chuyện tương tác mà không cần tinh chỉnh mô hình GPT.
Nói chung, có bốn khả năng về cách một công nghệ có thể tương tác với một mô hình nền tảng đã được huấn luyện sẵn cho mục đích huấn luyện và suy luận:

a) Suy luận thuần túy: trong trường hợp này, tác vụ được huấn luyện trước của mô hình nền tảng có thể được sử dụng trực tiếp cho các ứng dụng phía sau. Ví dụ, một mô hình siêu phân giải có thể trực tiếp tạo ra các hình ảnh đã được nâng cao độ phân giải.

b) Học không cần mẫu huấn luyện (Zero shot learning):

 Các mô hình ngôn ngữ lớn (LLMs) đã phổ biến khái niệm học không cần mẫu huấn luyện, trong đó một mô hình được sử dụng để phân loại một mục tiêu không xuất hiện trong tập huấn luyện của nó bằng cách cung cấp cho mô hình một mô tả giàu ngữ nghĩa về mục tiêu đó tại thời điểm suy luận. Ví dụ, mô hình VLM TEOChat thể hiện khả năng zero-shot bằng cách thực hiện trả lời câu hỏi trên các bộ dữ liệu cảm biến từ xa mới, không có trong tập huấn luyện ban đầu của mô hình (Irvin et al., 2024).

c) Học với ít mẫu (Few shot learning):

 Nhờ vào quá trình huấn luyện trước sâu rộng của các mô hình nền tảng, chỉ một vài ví dụ huấn luyện chuyên biệt cho tác vụ có thể được sử dụng để tinh chỉnh mô hình nền tảng hoặc phần đầu chiếu (projection head). Các kỹ thuật được sử dụng trong học với ít mẫu bao gồm huấn luyện lại một phần trọng số (e.g., LoRA, Hu et al., 2021) hoặc huấn luyện các phần đầu chiếu sử dụng đầu ra từ bộ mã hóa (encoder) của mô hình nền tảng làm đầu vào.

d) Tinh chỉnh toàn phần (Full fine tuning):

 Tinh chỉnh toàn bộ mô hình nền tảng có thể đạt được hiệu suất cao, nhưng thường đòi hỏi các bộ dữ liệu được gán nhãn đầy đủ hơn và tài nguyên tính toán lớn hơn

Một ví dụ về ứng dụng tích hợp tinh chỉnh toàn phần là do IBM, NASA và các đối tác khác phát triển với mô hình nền tảng Prithvi (Jakubik et al., 2023Szwarcman et al., 2025). Họ đã phát hành một ứng dụng số hỗ trợ quy trình tinh chỉnh, bao gồm quản lý tập dữ liệu trực tuyến, tài nguyên tính toán và các công cụ trực quan hóa (IBM Research, 2024). Các mô hình đã được tinh chỉnh và công bố rộng rãi bao gồm các phiên bản dành cho lập bản đồ vùng ngập lụt, vùng cháy rừng, phân loại cây trồng theo thời gian, và một nghiên cứu gần đây đã khảo sát khả năng tinh chỉnh để dự đoán khu vực sinh sản của châu chấu (IBM Research and NASA, 2025Yusuf et al., 2024).

Các trường hợp học không cần mẫu huấn luyện (zero shot) và học với ít mẫu (few shot) đặc biệt phù hợp với giao diện người dùng, vì các hình thức tương tác này được cải thiện đáng kể nhờ phản hồi từ người dùng.Các chiến lược “con người trong vòng lặp” (human-in-the-loop) có thể được áp dụng để tinh chỉnh mô hình một cách tương tác, như chúng tôi sẽ trình bày qua hai trường hợp dưới đây.

2.4. Các hệ thống này có thể tích hợp các công cụ AI mạnh mẽ trong tương lai như thế nào?

Việc tích hợp giữa các mô hình nền tảng AI trong viễn thám và các công nghệ AI khác mang lại nhiều cơ hội đáng kể để nâng cao giám sát môi trường và công nghệ hệ sinh thái. Như đã thảo luận ở trên, nhắc lệnh bằng ngôn ngữ tự nhiên là một khả năng đầy hứa hẹn. Điều này mở ra hàng loạt hình thức tương tác mà qua đó các mô hình AI đa năng, bao gồm cả các mô hình ngôn ngữ lớn như GPT, có thể bổ trợ và mở rộng các chức năng chuyên biệt của các mô hình viễn thám.

Trong tương lai, AI đa năng sẽ đơn giản hóa việc phân tích dữ liệu quy mô lớn, chuyển đổi các đầu ra từ mô hình viễn thám thành những thông tin có thể hành động được (ví dụ., Planet Labs PBC, 2025). Khai thác khả năng ngôn ngữ của các mô hình AI, người dùng không có nền tảng kỹ thuật chuyên sâu vẫn có thể dễ dàng truy vấn các tập dữ liệu phức tạp, yêu cầu phân tích chi tiết, hoặc khám phá các kịch bản chỉ thông qua các lời nhắc đơn giản. Chúng ta cũng có thể trông cậy vào AI tổng quát để tối ưu hóa quy trình giám sát môi trường. Các mô hình này có thể được sử dụng để điều chỉnh linh hoạt các thông số giám sát, xác định vị trí triển khai cảm biến tối ưu, hoặc ưu tiên các vùng cần phân tích dựa trên kết quả của các mô hình dự đoán.

Quan trọng là, việc tích hợp với các mô hình AI sinh dữ liệu (generative AI) mang đến những rủi ro vượt xa các lỗi thống kê vốn có ở bộ phân loại phân biệt (discriminative classifier). Nếu không được thiết kế kỹ lưỡng, một mô hình sinh như GPT có thể “tưởng tượng” ra thông tin không đúng sự thật hoặc hành xử trái với mục tiêu của ứng dụng số. Những rủi ro này có thể được giảm thiểu bằng cách quản lý phạm vi tích hợp, chẳng hạn bằng cách giới hạn việc truy xuất dữ liệu trong các nguồn tin cậy cụ thể và chuyển trực tiếp các nguồn đó đến người dùng. Sự chú ý chủ động từ người dùng và việc xác minh đầu ra từ mô hình sinh là điều cần thiết.

3. Đối tượng nghiên cứu: Earth Index

Giao diện người dùng thử nghiệm của chúng tôi, có tên là Earth Index, là một công cụ phân loại ảnh vệ tinh theo phương pháp few-shot, hoạt động thông qua việc nhắc lệnh dựa trên vị trí (location-based prompting) (Hình 1). Ở nhiều khía cạnh, nó có thể được xem như một công cụ tìm kiếm cho Trái Đất: người dùng chỉ định một vài đối tượng quan tâm trên bản đồ web, và trong thời gian thực, Earth Index sẽ hiển thị các đối tượng tương tự khác trong khu vực quan tâm (AOI).

Hình 1. Earth Index là một giao diện người dùng cùng với tập hợp các dịch vụ liên quan, được xây dựng dựa trên các mô hình nền AI trong viễn thám. Với Earth Index, người không chuyên cũng có thể tìm kiếm ảnh vệ tinh một cách tương tác, dựa trên kiến thức đã được học từ mô hình nền được huấn luyện sẵn.

Earth Index là một ứng dụng web vận hành thực tế, cung cấp các công cụ chấm điểm (point) và quét vùng (brush) để gán nhãn trên bản đồ web, các tùy chọn để tìm kiếm và xác nhận kết quả tìm kiếm, tập hợp các bản đồ nền ảnh vệ tinh, cùng với logic quản lý trạng thái và dự án. Ứng dụng xử lý các truy vấn của người dùng thông qua một cơ sở dữ liệu quan hệ có hỗ trợ không gian địa lý, nơi các embedding của mô hình được tính sẵn, lưu trữ và đánh chỉ mục. Embedding là đầu ra dạng vector của mô hình AI khi nhận vào một ô ảnh (image patch) - do đó, nó cung cấp một biểu diễn toán học cho các đối tượng và địa hình trên khu vực bề mặt Trái Đất đó. Để biết chi tiết kỹ thuật, vui lòng tham khảo phần Phụ lục Supplementary material. Quy trình làm việc cơ bản được thiết kế gần như tự giải thích cho nhóm người dùng mục tiêu, bao gồm các nhà nghiên cứu có chuyên môn trong lĩnh vực môi trường nhưng không cần có kiến thức trước về học máy.

Thông qua việc đọc kỹ các kết quả phát hiện được đề xuất và thêm các nhãn dương tính hoặc âm tính, người dùng sẽ tinh chỉnh tìm kiếm một cách lặp lại. Quá trình tìm kiếm này là mở. Ở cấp độ kỹ thuật, công cụ xây dựng một vector embedding đại diện từ các vector đã được gán nhãn, và thực hiện tìm kiếm các vector embedding lân cận gần nhất theo phương pháp xấp xỉ, trong phạm vi bán kính do người dùng xác định. Về mặt toán học, đây thực chất là một hệ thống gợi ý (recommendation system). Hiệu quả của nó dựa vào khả năng của mô hình nền trong việc tổ chức không gian vector embedding một cách hữu ích.

Bên cạnh khả năng phân biệt loại hình sử dụng đất (land cover), các mô hình nền trong viễn thám còn cung cấp biểu diễn tốt về các đối tượng trên bề mặt Trái Đất, đồng nghĩa với việc chúng có thể được sử dụng để phát hiện cơ sở hạ tầng công nghiệp và các dấu hiệu của hoạt động khai thác tài nguyên trái phép. Để đưa ra một ví dụ cụ thể, Mạng lưới Điều tra Rừng Nhiệt đới của Trung tâm Pulitzer (Pulitzer Center Rainforests Investigation Network) đang sử dụng Earth Index để điều tra hoạt động khai thác vàng lộ thiên quy mô nhỏ ở khu vực đồng bằng sông Mekong. Một nhà báo dữ liệu tại Trung tâm Pulitzer và một đồng tác giả của bài viết này đã bắt đầu tìm kiếm trong Earth Index từ những điểm mỏ được xác định trước đó trong các bản tin truyền thông. Qua quá trình tìm kiếm lặp lại và xác minh với các nguồn dữ liệu bên ngoài, chúng tôi đã học được những đặc điểm riêng biệt của các vết sẹo do khai thác mỏ ở khu vực này. Đáng chú ý, nhà ở của thợ mỏ và gia đình họ thường đan xen với các hồ bùn độc hại còn lại sau khi khai thác. Chúng tôi đã sử dụng sự hiểu biết này để xây dựng các tìm kiếm ngày càng chính xác hơn, cuối cùng tạo ra các bản đồ chi tiết của năm khu vực khai thác lớn trên một vùng rộng 200 km. Những phát hiện này đã định hướng cho các chuyến đi thực địa của một phóng viên địa phương, người đã phỏng vấn cả thợ mỏ lẫn các thành viên của các nhóm cộng đồng tuần tra rừng để ngăn chặn nạn khai thác gỗ trái phép. Phóng viên cho biết rất bất ngờ khi phải di chuyển hàng giờ trên đường đất bằng xe máy, dừng lại ở một khúc sông, đi bộ ngược dòng, và cuối cùng tìm thấy đúng khu mỏ đã được dự báo.

Những thách thức cho việc sử dụng bền vững công cụ này nằm ở chính khó khăn khi làm việc với ảnh vệ tinh: cần phải xây dựng các bài toán phù hợp với độ phân giải ảnh, diễn giải kết quả một cách chính xác, và kiên trì phân biệt đối tượng mục tiêu trong một bối cảnh phức tạp. Hiện chúng tôi đã bổ sung tài liệu hướng dẫn cho người dùng mới, bao gồm các ví dụ thực tế về quá trình tìm kiếm lặp.

3.1 Học máy được tinh giản

Tìm kiếm địa lý nhằm mục tiêu hiển thị các địa điểm tương tự với những địa điểm mà người dùng đã truy vấn, để người dùng đánh giá mức độ liên quan cao hay thấp. Để lập danh mục đầy đủ cho một hiện tượng, người ta thường cần đến học máy với dữ liệu đã được gán nhãn. Quy trình này đòi hỏi người dùng có mức độ thành thạo dữ liệu cao hơn so với cách tìm kiếm Trái Đất theo hướng mở.

Chúng tôi sử dụng một notebook Jupyter với giao diện bản đồ dựa trên Leaflet — một phiên bản thô của ứng dụng Earth Index — để huấn luyện các mô hình hồi quy logistic hoặc mạng nơ-ron đa tầng (MLP) trên các vector embedding đầu ra từ bộ mã hóa (encoder) của mô hình nền. Bản đồ vệ tinh trên web do Leaflet cung cấp hỗ trợ gán nhãn các địa điểm theo thời gian thực, bằng cách nhấp chuột trên bản đồ. Mã nguồn cho huấn luyện mô hình, đánh giá, kết hợp mô hình (ensembling) và suy luận được trình bày theo các phần kế tiếp của notebook.

Bằng cách xây dựng dựa trên mô hình nền, độ phức tạp của việc mô hình hóa về sau được giảm đi hàng bậc so với huấn luyện đầu-cuối (end-to-end). Trên một máy MacBook Pro, việc huấn luyện và suy luận bằng MLP trên một khu vực quan tâm (AOI) rộng 100.000 km² chỉ mất vài phút. Các thí nghiệm với ảnh chụp ở cấp độ đường phố cho thấy rằng việc kết hợp một mô hình nền đã được huấn luyện trước với một projection head có thể đạt — thậm chí vượt — hiệu năng của các mô hình được huấn luyện đầu-cuối bằng dữ liệu gán nhãn (Chen et al., 2020).

Trong một nghiên cứu thí điểm, chúng tôi đã áp dụng quy trình tinh giản này để xây dựng một bộ dữ liệu về các cơ sở chăn nuôi gia cầm tập trung (poultry animal feeding operations) trên khắp khu vực đông nam nước Mỹ — nơi bao gồm các bang sản xuất gia cầm lớn nhất. Các cơ sở chăn nuôi tập trung (Concentrated Animal Feeding Operations – CAFOs) là những trang trại nông nghiệp công nghiệp, nơi một số lượng lớn động vật được nuôi nhốt trong điều kiện chật hẹp. Các cơ sở này gây ra những mối đe dọa nghiêm trọng đối với môi trường và ảnh hưởng đến sức khỏe cũng như khả năng sinh sống của các cộng đồng lân cận (Crippa et al., 2021Nicole, 2013Wing et al., 2000).

Mặc dù các cơ sở này có nhiều điểm tương đồng về mặt hình ảnh giữa các bang, nhưng các nỗ lực ngây thơ nhằm ngoại suy một mô hình học máy từ bang này sang bang khác có thể gặp trở ngại do sự khác biệt về địa lý nền. Đây có thể được xem là một thách thức trong việc tinh chỉnh mô hình theo địa phương (local fine-tuning), nơi giao diện tích hợp nhãn và huấn luyện giúp tăng tốc quá trình lặp mô hình. Bắt đầu với một mô hình dựa trên dữ liệu đã gán nhãn từ bang North Carolina (Handan-Nader and Ho, 2019), và tiến hành qua các bước lấy mẫu âm (negative sampling) và huấn luyện lặp, chúng tôi đã xây dựng được một bộ mô hình theo từng bang, tạo nên — theo hiểu biết hiện tại của chúng tôi — bản đồ toàn diện nhất hiện có về các cơ sở chăn nuôi gia cầm trong khu vực  (Figure 2). Hiện không có cơ quan liên bang nào duy trì một danh bạ đầy đủ về vị trí các CAFO, và các quy định chắp vá giữa các bang để lại nhiều khoảng trống trong dữ liệu hiện có ở cấp bang (Miller and Muren, 2019).

Hình 2. Việc tinh chỉnh mô hình theo địa phương (local fine-tuning) với quy trình học máy của Earth Index dẫn đến các phát hiện chính xác về các CAFO gia cầm ở khu vực đông nam nước Mỹ. (a) Earth Index và một kho dữ liệu học máy trước đó (Robinson et al., 2022) có hiệu suất tương đương trong việc xác thực tại các khu vực mà dữ liệu huấn luyện được lấy mẫu (North Carolina và bán đảo Delmarva, tương ứng); với việc tinh chỉnh, Earth Index vẫn duy trì độ chính xác khi ngoại suy sang bang Arkansas, trong khi mô hình được ngoại suy một cách ngây thơ thì độ chính xác giảm từ 87% xuống còn khoảng 68%. Mặc dù sự khác biệt về thuật toán khiến phép so sánh này chưa hoàn hảo, nhưng nó vẫn làm nổi bật giá trị của việc tinh chỉnh mô hình. Chi tiết hơn, xin xem phần tài liệu bổ sung. (b) Một bộ các mô hình đã được tinh chỉnh theo từng bang từ Earth Index tạo ra bản đồ toàn diện, có độ trung thực cao về các cơ sở chăn nuôi gia cầm công nghiệp, với 16.372 phát hiện trên sáu bang được nghiên cứu.Thông tin chi tiết hơn về quy trình mô hình hóa có thể được tìm thấy trong Supplementary materials.

4. Kết luận

Việc phát triển các ứng dụng số mới dựa trên các mô hình nền tảng AI cho dữ liệu viễn thám đang đánh dấu một bước chuyển mình mang tính cách mạng trong giám sát môi trường. Những ứng dụng này đơn giản hóa và tăng tốc các quy trình gán nhãn dữ liệu, tinh chỉnh mô hình và xây dựng trực giác, cho phép triển khai các quy trình có sự tham gia của con người (human-in-the-loop) nhằm tạo ra dữ liệu chính xác và được điều chỉnh theo bối cảnh địa phương. Bằng cách thu hẹp khoảng cách giữa dữ liệu và các chuyên gia lĩnh vực, những công nghệ này giúp các đối tượng sử dụng ở hạ nguồn như nhà hoạch định chính sách, nhà báo, và các nhà hoạt động môi trường có thể xây dựng các tập dữ liệu có tác động lớn mà không cần chuyên môn kỹ thuật sâu.

Các ứng dụng số được xây dựng trên nền tảng AI cho dữ liệu viễn thám là những công cụ hỗ trợ mạnh mẽ cho các công nghệ sinh thái (ecotechnologies). Chúng có khả năng xử lý lượng lớn dữ liệu môi trường, cung cấp giám sát theo thời gian thực và tạo ra phân tích dự báo giúp nâng cao khả năng quản lý và phục hồi hệ sinh thái. Khi được kết hợp cùng chuyên gia qua các phân tích lặp đi lặp lại, những công cụ này có thể trở thành cầu nối từ dữ liệu thô đến những hiểu biết có thể hành động, thúc đẩy các can thiệp tích hợp và có hiểu biết sinh thái sâu sắc hơn.

Khi các mô hình nền tảng và ứng dụng số ngày càng trưởng thành, chúng tôi hình dung một tương lai nơi hệ thống công nghệ cho giám sát môi trường sẽ ngày càng có tính mô-đun và đơn giản hóa. Những người dùng ở giai đoạn hạ nguồn muốn khai thác dữ liệu viễn thám sẽ không còn cần phải học các kỹ năng kỹ thuật chuyên biệt để phát triển mô hình học máy. Thay vào đó, các công nghệ được điều khiển bằng giao diện đơn giản sẽ mở ra một tương lai hợp tác, nơi các chuyên gia lĩnh vực có thể tham gia trực tiếp vào quá trình phát triển mô hình. Các ứng dụng số sẽ đóng vai trò then chốt trong việc hiện thực hóa toàn bộ tiềm năng của các mô hình nền tảng, từ đó cho phép giám sát và quản lý môi trường một cách toàn diện ở quy mô toàn cầu — điều đang trở nên cấp thiết.

Các tập dữ liệu được trình bày trong nghiên cứu này có thể được tìm thấy tại các kho dữ liệu trực tuyến. Tên của các kho dữ liệu và số hiệu truy cập có thể được tìm thấy tại: https://github.com/earthrise-media/cafo-explorer/tree/main/da ta.

Attachments:

Nguyễn Đức Giang - Trung tâm Kiểm định sản phẩm và thiết bị viễn thám

Ý kiến

Vệ tinh Tanager-1 phát hiện và theo dõi các siêu phát thải khí CH4 và CO2

Vệ tinh siêu quang phổ Tanager-1 đã được phóng thành công vào ngày 16/8/2024 từ Căn cứ không gian Vandenberg, California. Tanager-1 là vệ tinh đầu tiên trong số 2 vệ tinh do Planet Labs PBC chế tạo và vận hành, được tài trợ bởi Liên minh Carbon Mapper trong nỗ lực phát triển và triển khai các vệ tinh với nhiệm vụ phát hiện và theo dõi các siêu phát thải khí mê-tan và CO¬¬2 để hỗ trợ hành động giảm thiểu các vấn đề biến đổi khí hậu.