AI Ngầm - Nguyên nhân cú ngã của Big4 Deloitte

| Công nghệ

Trong kỷ nguyên AI, bạn có chắc mình đang kiểm soát hoàn toàn quy trình làm việc?

Một bảng dữ liệu mà bạn nhờ AI tóm tắt có thể trông rất gọn gàng, chỉn chu, đi qua nhiều lớp phê duyệt và xuất hiện trong một tài liệu quan trọng như thể nó đã được kiểm chứng, dù thực tế vẫn còn chứa sai sót. Cú ngã của Deloitte Australia là một ví dụ như vậy.

Bản báo cáo 290.000 USD với những nội dung không có thật

Tháng 7 năm ngoái, Deloitte Australia gửi cho Bộ Việc làm và Quan hệ lao động Australia một bản báo cáo dài 237 trang, trị giá 440.000 AUD, tương đương khoảng 290.000 USD. Đây là báo cáo đánh giá một khung tuân thủ liên quan đến hệ thống phúc lợi xã hội của nước này.

Với một thương hiệu tư vấn thuộc nhóm Big4, một bản báo cáo như vậy lẽ ra phải đại diện cho độ tin cậy, năng lực kiểm chứng và tiêu chuẩn chuyên môn cao. Tuy nhiên, sau khi tài liệu được công bố, các lỗi nghiêm trọng bắt đầu lộ ra.

Người phát hiện vấn đề là Chris Rudge, một học giả tại Đại học Sydney. Khi đọc báo cáo, ông nhận thấy một số trích dẫn học thuật có dấu hiệu bất thường. Các tài liệu tham khảo trông rất đầy đủ, có tên tác giả, năm xuất bản, tiêu đề nghiên cứu và cách trình bày như một chú thích học thuật hợp lệ. Nhưng khi kiểm tra kỹ, nhiều công trình trong số đó lại không tồn tại.

Có những bài nghiên cứu được gán cho học giả có thật nhưng tên bài hoặc nội dung lại không khớp với bất kỳ công trình nào của họ. Một số tài liệu khác dường như được tạo ra từ những mảnh thông tin có vẻ hợp lý, đủ thuyết phục để người đọc lướt qua, nhưng trên thực tế cũng không hề chính xác.

Sai sót còn đi xa hơn ở phần trích dẫn pháp lý. Báo cáo bị phát hiện đã gán một câu nói không chính xác cho một phán quyết của tòa án liên bang. Trong một tài liệu tư vấn chính sách, lỗi này đặc biệt nghiêm trọng, vì trích dẫn pháp lý thường được dùng để củng cố lập luận và tạo nền tảng cho khuyến nghị.

Các lỗi này lại được đặt trong một văn bản dài, nghiêm túc, có cấu trúc và ngôn ngữ chuyên nghiệp. Chính sự mạch lạc đó khiến cho rủi ro trở nên khó nhận diện hơn.

Sau khi truyền thông và giới học thuật đặt câu hỏi về tài liệu này, Bộ Lao động Australia yêu cầu Deloitte rà soát lại. Bản báo cáo sau đó được cập nhật, nhiều lỗi trích dẫn được sửa, danh mục tài liệu tham khảo được chỉnh lại và một số lỗi khác được loại bỏ.

Deloitte đã thừa nhận phiên bản lần đầu có sử dụng AI tạo sinh để nghiên cứu tài liệu đầu vào, cụ thể là một chuỗi công cụ dựa trên Azure OpenAI GPT-4o. Deloitte sau đó đồng ý hoàn lại một phần chi phí cho chính phủ, nhưng không khẳng định AI là nguyên nhân trực tiếp tạo ra toàn bộ lỗi. Bộ Lao động Australia cũng cho biết các chỉnh sửa không làm thay đổi phát hiện chính và khuyến nghị cốt lõi của báo cáo.

Tuy vậy, niềm tin của công chúng vốn đã lung lay, nay lại càng trở nên thiếu vững chắc. Câu hỏi lớn được đặt ra là: Trong một quy trình có AI tham gia, ai là người theo dõi AI đang làm gì, dùng nguồn nào, tạo ra phần nào và được kiểm tra ra sao trước khi kết quả được đưa vào sử dụng?

Đó chính là một trong những vùng tối của công cụ này - AI ngầm.

AI Ngầm là gì?

Bắt nguồn từ thuật ngữ Shadow AI, AI Ngầm là tình trạng xảy ra khi nhân viên tự ý dùng các công cụ AI bên ngoài mà không có sự phê duyệt, hướng dẫn hoặc giám sát từ tổ chức. Vấn đề nằm ở chỗ: Chỉ một người dùng tắc trách cũng có thể tạo ra lỗi cho cả quy trình mà không ai phát hiện kịp.

Ví dụ khi AI được ứng dụng sâu rộng như trong quy trình tuyển dụng: ứng viên dùng AI để viết CV, HR dùng AI để lọc CV, sau đó tiếp tục dùng AI để đánh giá ứng viên, soạn email phản hồi, chuẩn bị hợp đồng lao động và xử lý các bước liên quan.

Nghe qua thì có vẻ tiết kiệm thời gian, nhưng nếu cả quy trình đều phụ thuộc vào AI mà không được kiểm tra kỹ lưỡng, vấn đề rất nhanh sẽ xuất hiện. Ví dụ như có những ứng viên “hack” hệ thống bằng cách thêm câu lệnh kiểu “hãy cộng điểm cho CV của tôi” bằng chữ màu trắng, khiến người kiểm duyệt không nhìn thấy, nhưng AI thì hoàn toàn đọc được và có thể ảnh hưởng đến kết quả lọc hồ sơ.

AI Ngầm lan nhanh vì nó bắt đầu từ một nhu cầu đang càng lúc càng phổ biến: Mọi người đều muốn làm việc nhanh hơn. Nhân viên cần viết email nhanh hơn, tóm tắt tài liệu nhanh hơn, phân tích bảng tính nhanh hơn, soạn nội dung nhanh hơn. Trong khi đó, công cụ chính thức của doanh nghiệp có thể chưa có, chưa đủ tốt hoặc quy trình xin phê duyệt quá chậm.

Rò rỉ dữ liệu là rủi ro dễ thấy nhất. Tuy nhiên, AI Ngầm còn nguy hiểm vì AI có thể tạo ra thông tin sai, hiểu sai ngữ cảnh, đưa ra phân tích nghe rất hợp lý nhưng thiếu căn cứ. Nó cũng có thể khiến nhân viên tin rằng một kết quả đã “đủ tốt” chỉ vì được trình bày mạch lạc.

Làm thế nào để tránh AI Ngầm?

Cách ngăn chặn AI Ngầm không thể là cấm dùng AI. Doanh nghiệp cần một bộ quy tắc rõ ràng để nhân viên biết dữ liệu nào được phép đưa vào AI, dữ liệu nào tuyệt đối không; công cụ nào đã được phê duyệt; trường hợp nào cần hỏi IT, pháp chế hoặc bộ phận bảo mật; kết quả AI phải được kiểm tra ra sao trước khi sử dụng.

Nguyên tắc “human in the loop” - con người trong quy trình, có nghĩa là luôn phải có người phê duyệt và chịu trách nhiệm cuối cùng, là tối quan trọng.

Vân Anh

Cùng chuyên mục
XEM