Nghiên cứu tập trung vào bài toán phân đoạn ngữ nghĩa (semantic segmentation) đối với các vết nứt, bong tróc và hư hỏng bê tông trên mái đê. Trong thực tế, ảnh UAV thu nhận ngoài trời thường chịu ảnh hưởng lớn của điều kiện ánh sáng thay đổi, bóng đổ, thực vật che khuất, phản xạ nước hoặc nhiễu nền phức tạp. Đây là nguyên nhân khiến nhiều mô hình học sâu truyền thống giảm hiệu quả nhận dạng. Đồng thời, việc triển khai trực tiếp trên UAV hoặc các hệ thống giám sát thời gian thực cũng đòi hỏi thuật toán có tốc độ xử lý cao và mức tiêu thụ tài nguyên tính toán thấp. Để giải quyết các hạn chế này, nhóm tác giả đã xây dựng một mô hình U-Net cải tiến theo hướng “lightweight network”, tức mạng nhẹ hóa nhưng vẫn duy trì độ chính xác cao. Điểm nổi bật đầu tiên của nghiên cứu là áp dụng kỹ thuật “global-local channel pruning”, cho phép loại bỏ các kênh đặc trưng dư thừa trong mạng học sâu nhằm giảm số lượng tham số và tăng tốc độ suy luận. Theo kết quả thí nghiệm, việc pruning giúp tốc độ xử lý tăng gần 2,7 lần so với mô hình gốc mà chỉ làm giảm nhẹ độ chính xác. Bên cạnh đó, nghiên cứu tích hợp cơ chế chú ý ResCBAM (Residual Convolutional Block Attention Module), kết hợp đồng thời attention theo không gian và attention theo kênh để làm nổi bật các vùng hư hỏng thực sự, đồng thời giảm ảnh hưởng của nhiễu nền. Cơ chế này đặc biệt hiệu quả trong các tình huống có bề mặt đê bị bẩn, xuất hiện lỗ nhỏ, thực vật che phủ hoặc ánh sáng yếu. Các hình minh họa trong bài báo cho thấy mô hình đề xuất vẫn duy trì khả năng phát hiện chính xác các vết nứt nhỏ trong điều kiện nền phức tạp, trong khi nhiều mô hình đối chứng bỏ sót hoặc nhận dạng sai. Một đóng góp quan trọng khác là cơ chế “online feature distillation” kết hợp “multi-scale feature fusion”. Thay vì chỉ khai thác đặc trưng ở một mức độ phân giải, mô hình đồng thời học và hợp nhất đặc trưng đa tỷ lệ, giúp tăng khả năng nhận diện các vết nứt nhỏ, kéo dài hoặc biến dạng phức tạp. Quá trình distillation cho phép mạng học sinh (student network) tiếp thu “tri thức ngầm” từ mạng giáo viên (teacher network), từ đó cải thiện độ chính xác mà vẫn đảm bảo mô hình gọn nhẹ. Dữ liệu thực nghiệm được thu nhận bằng UAV DJI Matrice 600 Pro trên một tuyến đê dài khoảng 1.200 m. Hệ thống UAV sử dụng camera độ phân giải 16 MP với thời gian bay khoảng 32 phút, cho phép thu nhận ảnh chi tiết của các vết nứt bề mặt. Các ảnh độ phân giải cao sau đó được chia nhỏ bằng kỹ thuật sliding window để xây dựng tập dữ liệu huấn luyện và kiểm thử. Kết quả thực nghiệm cho thấy mô hình đề xuất đạt độ chính xác (Accuracy) 90,05%, Recall 88,94%, Precision 89,22% và IoU 88,67%, đồng thời đạt tốc độ xử lý 57,74 FPS – cao hơn đáng kể so với các mô hình nổi tiếng như Attention U-Net, DeepLabv3, HRNet hay SegNet. Đặc biệt, mô hình vẫn duy trì khả năng nhận dạng tốt trong các môi trường có ánh sáng yếu, nền gồ ghề hoặc nhiễu mạnh. Điều này cho thấy tính thực tiễn rất cao của giải pháp trong các nhiệm vụ giám sát công trình ngoài hiện trường. Đối với Việt Nam, nghiên cứu này có tiềm năng ứng dụng rất lớn trong lĩnh vực quản lý đê điều, hồ chứa và hạ tầng thủy lợi. Việt Nam hiện có hệ thống đê sông và đê biển dài hàng nghìn kilômét, phân bố rộng tại Đồng bằng sông Hồng, Bắc Trung Bộ và Đồng bằng sông Cửu Long. Công tác kiểm tra hiện nay chủ yếu vẫn dựa vào khảo sát thủ công, tiêu tốn nhiều nhân lực và khó phát hiện sớm các hư hỏng nhỏ. Việc ứng dụng UAV kết hợp AI có thể hỗ trợ xây dựng hệ thống giám sát tự động, định kỳ và diện rộng với chi phí thấp hơn đáng kể.Trong điều kiện Việt Nam, công nghệ này đặc biệt phù hợp để giám sát các tuyến đê biển chịu tác động của xâm nhập mặn, sóng lớn và sụt lún nền đất; kiểm tra mái đập thủy điện, hồ chứa miền núi; cũng như phát hiện nứt vỡ bê tông tại các công trình thủy lợi lâu năm. Ngoài ra, với tốc độ xử lý thời gian thực, mô hình có thể tích hợp trực tiếp trên các nền tảng UAV hoặc trung tâm điều hành giám sát thiên tai, hỗ trợ cảnh báo sớm nguy cơ mất an toàn công trình trong mùa mưa lũ.Tuy nhiên, để triển khai hiệu quả tại Việt Nam, cần xây dựng bộ dữ liệu ảnh UAV đặc thù cho từng loại công trình và điều kiện khí hậu khác nhau. Các yếu tố như độ ẩm cao, rong rêu, bề mặt bê tông phong hóa hoặc môi trường nhiệt đới có thể tạo ra kiểu nhiễu khác biệt so với dữ liệu nghiên cứu gốc tại Trung Quốc. Đồng thời, cần kết hợp dữ liệu đa nguồn như ảnh nhiệt, LiDAR hoặc mô hình số bề mặt nhằm nâng cao độ tin cậy trong các điều kiện che khuất phức tạp. Nhìn chung, nghiên cứu của Wu và cộng sự đã cho thấy xu hướng phát triển mới của viễn thám UAV kết hợp học sâu nhẹ hóa trong giám sát hạ tầng thủy lợi. Với khả năng phát hiện hư hỏng chính xác, tốc độ xử lý cao và tính thích ứng tốt trong môi trường thực địa, phương pháp này mở ra triển vọng xây dựng các hệ thống giám sát đê điều thông minh tại Việt Nam, góp phần nâng cao năng lực phòng chống thiên tai và quản lý an toàn công trình trong bối cảnh biến đổi khí hậu ngày càng gia tăng.