Dự thảo Bộ tiêu chí được xây dựng trong bối cảnh Chính phủ giao Bộ Khoa học và Công nghệ chủ trì xây dựng và triển khai Nền tảng Trí tuệ nhân tạo hỗ trợ công vụ ở phạm vi quốc gia nhằm hỗ trợ cán bộ, công chức, viên chức thực thi công vụ trên nhiều lĩnh vực quản lý nhà nước. Đây là lần đầu tiên Việt Nam xây dựng một bộ tiêu chuẩn đánh giá chuyên biệt cho nền tảng AI phục vụ hoạt động công quyền ở quy mô quốc gia, qua đó đặt nền móng cho việc hình thành hệ sinh thái AI công vụ thống nhất, có khả năng triển khai đồng bộ trên phạm vi toàn quốc.Nền tảng trí tuệ nhân tạo hỗ trợ công vụMột trong những điểm nổi bật nhất của bộ tiêu chí là cách tiếp cận lấy pháp luật làm trung tâm. Theo dự thảo, mọi kết quả đầu ra của nền tảng AI đều phải có khả năng dẫn chiếu cụ thể đến điều, khoản, điểm của các văn bản quy phạm pháp luật đã được công bố công khai. Nguyên tắc này giúp phân biệt rõ nền tảng AI công vụ với các hệ thống AI thương mại phổ biến hiện nay vốn chủ yếu tập trung vào khả năng sinh ngôn ngữ tự nhiên nhưng chưa bảo đảm tính giải trình về mặt pháp lý. Trong môi trường công vụ, nơi mọi quyết định đều phải dựa trên căn cứ pháp luật và có thể bị kiểm tra, giám sát hoặc thanh tra sau này, yêu cầu dẫn chiếu nguồn đến từng điều khoản cụ thể là điều kiện tiên quyết để bảo đảm độ tin cậy của hệ thống.Bộ tiêu chí cũng thể hiện nhận thức rõ ràng về vai trò của AI trong quản trị nhà nước. AI được xác định chỉ là công cụ hỗ trợ tham mưu, tổng hợp, phân tích và đề xuất; quyền quyết định cuối cùng vẫn thuộc về cán bộ, công chức, viên chức có thẩm quyền. Cách tiếp cận này phù hợp với xu thế quốc tế về “human-in-the-loop”, tức con người luôn giữ vai trò kiểm soát cuối cùng đối với các quyết định quan trọng có tác động đến xã hội. Điều đó giúp hạn chế nguy cơ lệ thuộc vào thuật toán và tránh những rủi ro phát sinh khi AI đưa ra các khuyến nghị chưa chính xác hoặc chưa đầy đủ.Về cấu trúc, bộ tiêu chí được thiết kế với tổng điểm tối đa 100 điểm, gồm hai nhóm chính. Nhóm A là các tiêu chí chung với 15 điểm, tập trung đánh giá năng lực tuân thủ pháp luật, khả năng dẫn chiếu nguồn, quản trị dữ liệu, tuân thủ các quy định về AI và năng lực hạ tầng kỹ thuật. Nhóm B chiếm tới 85 điểm, đánh giá năng lực hỗ trợ công vụ theo các lĩnh vực quản lý nhà nước của 14 bộ và 3 cơ quan ngang bộ. Cách phân bổ này phản ánh tư duy thực chất khi trọng tâm đánh giá không nằm ở các tuyên bố công nghệ mà tập trung vào khả năng giải quyết các yêu cầu nghiệp vụ cụ thể trong từng ngành, lĩnh vực.Đặc biệt, việc xây dựng bộ câu hỏi kiểm thử gồm 1.050 câu hỏi tương ứng với 104 tiêu chí đánh giá cho thấy nỗ lực lượng hóa và chuẩn hóa quy trình đánh giá. Thay vì đánh giá cảm tính hoặc dựa trên các bài trình diễn sản phẩm, các nền tảng AI sẽ phải trải qua quá trình kiểm thử bằng các tình huống nghiệp vụ thực tế. Đây là cách tiếp cận tương đối tiên tiến, gần với phương pháp benchmark đang được nhiều quốc gia và tổ chức quốc tế áp dụng để đánh giá các mô hình AI quy mô lớn.Một điểm đáng chú ý khác là bộ tiêu chí đã đưa ra các “điểm liệt”, tức các điều kiện loại trực tiếp bất kể tổng điểm đạt được. Trong đó bao gồm các lỗi nghiêm trọng như bịa đặt căn cứ pháp luật, dẫn chiếu sai văn bản, sử dụng văn bản hết hiệu lực mà không cảnh báo hoặc không có cơ chế dẫn chiếu nguồn. Đây là những quy định hoàn toàn hợp lý bởi chỉ cần một sai sót trong các nội dung này cũng có thể dẫn đến hậu quả pháp lý lớn trong hoạt động quản lý nhà nước.Tuy nhiên, bên cạnh những điểm tích cực, dự thảo bộ tiêu chí cũng đặt ra một số vấn đề cần tiếp tục nghiên cứu hoàn thiện.Trước hết, việc quy định “không sử dụng mô hình ngôn ngữ lớn tiếng Việt” là một tiêu chí điểm liệt cần được xem xét thận trọng hơn. Mục tiêu thúc đẩy tự chủ công nghệ và phát triển các mô hình AI do Việt Nam làm chủ là hoàn toàn đúng đắn. Tuy nhiên, trong giai đoạn hiện nay, hệ sinh thái AI Việt Nam vẫn đang trong quá trình phát triển. Nếu áp dụng tiêu chí loại trực tiếp đối với các nền tảng sử dụng hoặc kết hợp các mô hình quốc tế tiên tiến, nguy cơ thu hẹp không gian đổi mới sáng tạo là khá lớn. Thay vì coi đây là điều kiện loại trừ tuyệt đối, có thể chuyển thành tiêu chí đánh giá mức độ tự chủ công nghệ với trọng số phù hợp nhằm khuyến khích doanh nghiệp trong nước từng bước nâng cao năng lực làm chủ công nghệ lõi.Thứ hai, bộ tiêu chí hiện nay tập trung rất mạnh vào khả năng trả lời đúng theo văn bản pháp luật nhưng chưa dành mức độ quan tâm tương xứng cho tiêu chí cập nhật dữ liệu pháp lý. Trong thực tế, hệ thống pháp luật luôn thay đổi với tần suất cao. Một nền tảng có khả năng trả lời chính xác nhưng dựa trên cơ sở dữ liệu đã lỗi thời vẫn có thể dẫn đến các kết quả sai lệch. Vì vậy, cần bổ sung tiêu chí đánh giá về chu kỳ cập nhật văn bản, tốc độ đồng bộ các văn bản mới ban hành, sửa đổi hoặc thay thế, cũng như khả năng tự động phát hiện văn bản hết hiệu lực.Thứ ba, mặc dù bộ tiêu chí đã đề cập đến vấn đề minh bạch, quản trị dữ liệu và kiểm soát của con người, song các yêu cầu về đánh giá hiệu năng mô hình AI vẫn còn tương đối hạn chế. Trong tương lai, khi nền tảng được mở rộng quy mô phục vụ hàng triệu lượt truy vấn từ cán bộ, công chức trên toàn quốc, các tiêu chí về tốc độ phản hồi, khả năng chịu tải, mức độ ổn định, tỷ lệ lỗi hệ thống và khả năng phục hồi sau sự cố cần được quy định rõ ràng hơn.Một nội dung rất đáng ghi nhận là việc đưa tiêu chí kiểm tra chồng chéo, mâu thuẫn, không thống nhất giữa các văn bản quy phạm pháp luật vào nhóm đánh giá chuyên ngành. Điều này cho thấy tầm nhìn vượt ra ngoài chức năng hỏi đáp pháp luật thông thường để hướng tới việc hỗ trợ cơ quan quản lý phát hiện các bất cập trong hệ thống pháp luật hiện hành. Nếu được triển khai hiệu quả, AI có thể trở thành công cụ hỗ trợ đắc lực cho công tác rà soát, hoàn thiện thể chế, góp phần nâng cao chất lượng xây dựng pháp luật và giảm thiểu các xung đột pháp lý trong thực tiễn.Ở góc độ chiến lược, bộ tiêu chí đang mở ra một hướng tiếp cận mới cho việc phát triển AI trong khu vực công của Việt Nam. Thay vì chạy theo các xu hướng công nghệ mang tính trình diễn, Bộ Khoa học và Công nghệ lựa chọn cách tiếp cận dựa trên yêu cầu nghiệp vụ, tính tuân thủ pháp luật và khả năng giải trình. Đây là hướng đi phù hợp với đặc thù quản trị nhà nước, nơi độ chính xác, tính minh bạch và trách nhiệm giải trình luôn quan trọng hơn khả năng tạo sinh nội dung đơn thuần.Có thể thấy rằng, dự thảo Bộ tiêu chí đánh giá Nền tảng Trí tuệ nhân tạo hỗ trợ công vụ ở phạm vi quốc gia không chỉ là một tài liệu kỹ thuật phục vụ công tác thẩm định sản phẩm AI mà còn là nền tảng chính sách quan trọng cho việc hình thành hệ sinh thái AI công vụ quốc gia trong tương lai. Với những nguyên tắc rõ ràng về tuân thủ pháp luật, minh bạch nguồn dữ liệu, kiểm soát của con người và bảo đảm chủ quyền công nghệ, bộ tiêu chí đã bước đầu xác lập khung quản trị cần thiết cho việc ứng dụng AI trong khu vực công.Trong thời gian tới, việc tiếp tục hoàn thiện các tiêu chí liên quan đến cập nhật dữ liệu pháp luật, đánh giá hiệu năng hệ thống, an toàn thông tin, tự chủ công nghệ và khả năng tích hợp liên thông sẽ giúp bộ tiêu chí trở thành công cụ đánh giá toàn diện hơn. Khi đó, Việt Nam không chỉ sở hữu một nền tảng AI hỗ trợ công vụ quy mô quốc gia mà còn từng bước hình thành mô hình quản trị AI công có trách nhiệm, hiệu quả và phù hợp với điều kiện phát triển của đất nước trong kỷ nguyên số.