Cảnh báo: Câu trả lời từ AI không phải là nguồn đáng tin cậy. Vì sao?
Điều gì khiến AI vẫn chưa trở thành nguồn đáng tin cậy hoàn toàn?
AI ảo giác ( AI hallucination ) là thuật ngữ chỉ việc AI bịa ra một câu trả lời sai, nhưng trình bày như thể nó rất chắc chắn . Ví dụ, nếu bạn hỏi tên tác giả của một cuốn sách không tồn tại, AI có thể vẫn trả lời vanh vách: tác giả này là ai, xuất bản năm nào, nội dung ra sao. Nghe rất thuyết phục, nhưng tất cả có thể là bịa.
Tại sao AI lại bịa thay vì đơn giản nói “Tôi không biết”?
Lý do nằm ở cách AI hoạt động: các mô hình ngôn ngữ lớn không thực sự “hiểu” các nội dung mà nó nhìn thấy hay tạo ra giống như con người. Chúng được huấn luyện trên lượng dữ liệu khổng lồ và học cách dự đoán: trong ngữ cảnh này, từ nào hoặc câu nào có khả năng xuất hiện cao nhất tiếp theo?
Vì vậy, AI rất giỏi tạo ra câu trả lời nghe hợp lý , nhưng không đồng nghĩa với chính xác . Một câu trả lời có thể đúng vì nó khớp với dữ liệu đáng tin cậy mà AI từng học, nhưng cũng có thể sai vì AI ghép các mảnh thông tin lại theo cách có vẻ logic nhưng thực tế không đúng.
Điều nguy hiểm là AI thường viết rất mạch lạc. Người đọc, đặc biệt là người không rành công nghệ, dễ có cảm giác: “Nó nói chắc chắn thế này thì chắc là đúng.” Nhưng sự tự tin trong văn phong của AI không phải bằng chứng cho độ chính xác.
Bạn có thể hỏi: tại sao không yêu cầu AI nếu không biết thì cứ nói “tôi không biết” là xong. Nhưng chuyện không đơn giản như vậy.
Trước hết, AI không thật sự “biết rằng mình không biết”. Nó không có cảm giác nghi ngờ giống con người. Khi nhận được câu hỏi, nhiệm vụ chính của nó là tạo ra một câu trả lời có vẻ phù hợp với ngữ cảnh. Nếu trong dữ liệu huấn luyện, những câu trả lời dài, đầy đủ, tự tin thường được đánh giá cao hơn, AI sẽ có xu hướng tạo ra kiểu câu trả lời như vậy.
Bạn có thể so sánh điều này với một bài kiểm tra trắc nghiệm: trả lời đúng thì được điểm, trả lời sai không bị trừ điểm, còn bỏ trống cũng không được điểm, thì cách có lợi nhất là cứ đoán bừa đáp án. Đoán sai thì không mất gì, nhưng biết đâu đoán đúng lại được điểm. Thuật toán của AI cũng thường bị khuyến khích theo hướng đó: đưa ra một câu trả lời nghe có ích thì tốt hơn là im lặng hoặc nói “tôi không biết” .
Ngoài ra, người dùng cũng thường không thích câu trả lời “tôi không biết”. Nếu AI thường xuyên nói “tôi không biết”, nhiều người sẽ thấy nó vô dụng. Vì thế, trong quá trình phát triển, các mô hình thường được tối ưu để cố gắng trả lời nhiều nhất có thể. Điều này làm AI hữu ích hơn trong nhiều tình huống, nhưng cũng khiến nó dễ bịa hơn khi thiếu thông tin.
Nói cách khác, AI không bịa vì nó muốn lừa bạn. Nó bịa vì cơ chế của nó là tạo ra câu trả lời có xác suất nghe đúng cao nhất , chứ không phải lúc nào cũng kiểm chứng được sự thật.
AI đã chính xác hơn, nhưng người dùng vẫn nên biết cách hỏi để giảm “ảo giác”
Hiện nay, nhiều mô hình AI đã được cải thiện đáng kể. Chúng có thể tra cứu thông tin tốt hơn, biết nói thận trọng hơn, và trong một số trường hợp có thể nêu nguồn hoặc cảnh báo khi dữ liệu không chắc chắn. Tuy nhiên, hiện tượng ảo giác vẫn chưa biến mất hoàn toàn.
Vì vậy, khi dùng AI, đặc biệt với các chủ đề quan trọng như sức khỏe, pháp luật, tài chính, học thuật, tin tức hoặc số liệu, bạn nên thêm vào prompt (lời chỉ dẫn cho AI) những câu giúp AI thận trọng hơn. Ví dụ:
“Nếu bạn không chắc chắn, hãy nói rõ là không chắc chắn, đừng đoán.”
“Chỉ trả lời dựa trên thông tin có căn cứ. Nếu thiếu dữ liệu, hãy nói ‘tôi không có đủ thông tin’.”
“Hãy nêu rõ phần nào là sự thật đã được xác minh, phần nào là suy luận hoặc phỏng đoán.”
“Nếu câu hỏi của tôi chưa đủ rõ, hãy hỏi lại trước khi trả lời.”
“Hãy đưa ra nguồn hoặc cách kiểm chứng cho các thông tin quan trọng.”
“Đừng trả lời quá tự tin nếu dữ liệu có thể sai hoặc đã lỗi thời (đi kèm khoảng thời gian cụ thể cho câu trả lời được xem là đáng tin cậy, ví dụ 6 tháng trở lại đây).”
Tóm lại, hãy xem AI như một trợ lý thông minh nhưng không hoàn hảo. Nó có thể giúp bạn giải thích, tóm tắt, gợi ý và viết lách rất tốt. Nhưng với những thông tin cần độ chính xác cao, bạn vẫn nên kiểm tra lại.


