AI Hallucination là gì? Cách phát hiện và tránh bị AI "bịa" thông tin

Một luật sư tại New York nộp hồ sơ trích dẫn 6 án lệ – tất cả đều do ChatGPT tạo ra, và không có án lệ nào tồn tại. Một chatbot của hãng hàng không hứa hoàn tiền theo chính sách mà hãng chưa bao giờ có và tòa án buộc hãng phải trả. Một nhân viên kế toán dùng AI dịch hợp đồng pháp lý, không kiểm tra lại, dẫn đến sai sót hàng trăm triệu đồng.

Tất cả đều là hậu quả của cùng một hiện tượng: AI Hallucination – hay còn gọi là “ảo giác AI”.

Theo báo cáo của Suprmind (2026), tổn thất toàn cầu do AI hallucination đã lên tới 67,4 tỷ USD chỉ riêng trong năm 2024, và 47% lãnh đạo doanh nghiệp thừa nhận đã ra quyết định dựa trên thông tin do AI bịa ra mà không kiểm chứng. Đây không phải lỗi của riêng của một công cụ AI cụ thể mà là đặc tính cố hữu của mọi mô hình AI ngôn ngữ lớn (LLM) hiện nay.

Vậy AI Hallucination thực sự là gì, tại sao nó xảy ra, và quan trọng nhất làm sao để phát hiện và phòng tránh?

Mục lục

AI Hallucination là gì?

AI Hallucination (ảo giác AI) là hiện tượng các mô hình AI tạo ra thông tin có vẻ hợp lý, được trình bày tự tin, nhưng thực tế hoàn toàn sai, bịa đặt, hoặc không có cơ sở.

Điều đáng lo ngại nhất: AI không nhận ra mình đang sai. Không giống con người biết khi nào mình không chắc chắn, AI trình bày thông tin bịa đặt với cùng mức độ tự tin như thông tin chính xác.

Tại sao AI lại “bịa” thông tin?

Để hiểu tại sao hallucination xảy ra, cần hiểu cách AI hoạt động ở mức cơ bản:

1. AI không “hiểu” mà nó “dự đoán”

Các mô hình ngôn ngữ lớn (LLM) như ChatGPT, Claude, hay Gemini hoạt động bằng cách dự đoán từ tiếp theo có xác suất cao nhất dựa trên ngữ cảnh. Chúng không thực sự “hiểu” nội dung hay “biết” sự thật, chúng tìm ra pattern (mẫu) từ hàng tỷ văn bản và tái tạo lại. Khi gặp câu hỏi mà dữ liệu huấn luyện không đủ rõ ràng, AI sẽ “điền vào chỗ trống” bằng thông tin có vẻ hợp.

2. Dữ liệu huấn luyện có giới hạn và nhiễu

AI được huấn luyện trên dữ liệu từ internet, bao gồm cả thông tin chính xác lẫn sai lệch. Nếu nhiều nguồn internet đề cập một thông tin sai, AI có thể “học” và tái tạo thông tin sai đó như sự thật.

3. Không có cơ chế “tôi không biết”

Mặc định, hầu hết AI được thiết kế để luôn đưa ra câu trả lời, thay vì nói “tôi không biết”. Điều này dẫn đến việc AI tạo ra thông tin bịa đặt thay vì thừa nhận giới hạn của mình, đặc biệt khi prompt quá mơ hồ hoặc yêu cầu thông tin quá cụ thể.

4. Prompt mơ hồ làm tăng rủi ro

Theo ScottGraffius.com (2026), tỷ lệ hallucination tăng đáng kể khi prompt thiếu bối cảnh và giới hạn rõ ràng. Với các tác vụ đơn giản (tóm tắt văn bản), tỷ lệ hallucination có thể dưới 1%. Nhưng với các câu hỏi phức tạp đòi hỏi suy luận nhiều bước, tỷ lệ có thể vượt 33%, tức cứ 3 câu trả lời thì 1 câu chứa thông tin sai.

AI Hallucination nghiêm trọng đến mức nào?

Không có mô hình AI nào miễn nhiễm với hallucination. Theo dữ liệu từ Suprmind tổng hợp nhiều benchmark:

Số liệu thực tế thể hiện tỷ lệ hallucination theo mô hình AI (2025–2026)

Mức độ tác vụ	Tỷ lệ hallucination	Ví dụ
Tác vụ đơn giản (tóm tắt có nguồn)	0,7%–2%	Tóm tắt bài báo, trích xuất thông tin từ văn bản cho sẵn
Tác vụ trung bình	3%–20%	Trả lời câu hỏi kiến thức chung, viết nội dung
Câu hỏi pháp lý	18,7%	Trích dẫn luật, án lệ, quy định
Câu hỏi y tế	15,6%	Tư vấn sức khỏe, phân tích triệu chứng
Suy luận phức tạp / Open-domain	33%+	Phân tích đa chiều, dự báo, suy luận logic nhiều bước

Đáng quan ngại là ngay cả các mô hình tốt nhất hiện nay cũng hallucinate ít nhất 0,7% thời gian trên các tác vụ đơn giản nhất và tỷ lệ tăng vọt khi tác vụ phức tạp hơn.

Case Study: 3 vụ việc nổi tiếng về AI Hallucination

Case 1: Luật sư nộp án lệ giả do ChatGPT bịa ra (Mata v. Avianca, 2023)

Đây là vụ việc được xem là “bài học cảnh tỉnh” lớn nhất về AI hallucination trong ngành luật.

Luật sư Steven Schwartz tại New York sử dụng ChatGPT để nghiên cứu pháp lý cho vụ kiện Mata v. Avianca. Trong hồ sơ nộp tòa, ông trích dẫn 6 án lệ do ChatGPT tạo ra, với tên vụ án, số hiệu, và nội dung trích dẫn hoàn toàn không tồn tại.

Khi bị phát hiện, luật sư Schwartz khai rằng ông đã hỏi lại ChatGPT để xác nhận các án lệ có thật hay không và ChatGPT khẳng định chúng là thật. Tòa án đã phạt mỗi luật sư liên quan 5.000 USD và yêu cầu tham gia khóa đào tạo bắt buộc về đạo đức nghề nghiệp.

Bài học: AI có thể bịa ra thông tin rất chi tiết và khi bạn hỏi lại AI để kiểm chứng, nó có thể tiếp tục khẳng định thông tin sai. Kiểm chứng phải được thực hiện bằng nguồn bên ngoài AI, không phải bằng chính AI.

Case 2: Chatbot Air Canada hứa hoàn tiền sai chính sách (2024)

Hành khách Jake Moffatt liên hệ chatbot của Air Canada để hỏi về chính sách vé giảm giá tang lễ (bereavement fare). Chatbot trả lời rằng hành khách có thể đặt vé trước rồi xin hoàn tiền trong vòng 90 ngày, thông tin này hoàn toàn sai so với chính sách thực tế của Air Canada.

Khi Moffatt yêu cầu hoàn tiền, Air Canada từ chối và lập luận rằng chatbot là “thực thể riêng biệt” và công ty không chịu trách nhiệm. Tòa án bác bỏ lập luận này, khẳng định Air Canada phải chịu trách nhiệm cho mọi thông tin trên website, bao gồm cả nội dung do chatbot AI tạo ra.

Bài học: Doanh nghiệp triển khai AI phải chịu trách nhiệm pháp lý cho thông tin AI cung cấp, ngay cả khi thông tin đó là hallucination.

Case 3: Luật sư California bị phạt 10.000 USD vì 21/23 trích dẫn là giả (2025)

Trong vụ Noland v. Land of the Free, tòa phúc thẩm California phát hiện 21 trong 23 trích dẫn pháp lý trong bản kháng cáo của nguyên đơn là bịa đặt (các trích dẫn và nội dung không tồn tại trong bất kỳ án lệ nào).

Tòa phạt luật sư 10.000 USD, yêu cầu gửi bản án cho thân chủ, và chuyển hồ sơ đến Đoàn Luật sư Bang California. Tòa nhấn mạnh: cả phía bị đơn cũng bị phê bình vì “không phát hiện và báo cáo các trích dẫn giả”.

Bài học: AI hallucination trong lĩnh vực pháp lý không phải “sự cố hiếm gặp”, đây là rủi ro hệ thống đang gia tăng.

5 cách phát hiện AI Hallucination trong công việc

1. Luôn yêu cầu AI trích dẫn nguồn, rồi kiểm tra nguồn đó

Đây là cách đơn giản nhất và hiệu quả nhất. Khi AI đưa ra số liệu, sự kiện, hoặc trích dẫn, hãy yêu cầu:

“Cung cấp nguồn cụ thể cho mỗi số liệu: tên tổ chức, năm công bố, và link nếu có.”

Sau đó, kiểm tra từng nguồn bằng Google hoặc truy cập trực tiếp. Nếu AI đưa ra link không mở được, tên tổ chức không tồn tại, hoặc số liệu không khớp, đó là hallucination.

Dấu hiệu đỏ: AI cung cấp nguồn nhưng không kèm link, hoặc link trả về trang 404.

2. Kiểm tra chéo với ít nhất 2 nguồn độc lập

Không bao giờ tin một thông tin chỉ vì AI nói vậy. Với bất kỳ thông tin quan trọng như số liệu tài chính, quy định pháp lý, dữ liệu thị trường, hãy đối chiếu với ít nhất 2 nguồn độc lập bên ngoài AI.

Nguyên tắc: Nếu thông tin đó không thể tìm thấy trên bất kỳ nguồn uy tín nào khác ngoài AI, rất có thể nó là hallucination.

3. Sử dụng kiến thức chuyên môn của bạn như “bộ lọc”

Đây là lợi thế lớn nhất của người có chuyên môn vì bạn biết khi nào điều gì đó “nghe không đúng”. Nếu AI đưa ra một con số, một khái niệm, hay một quy trình mà trực giác chuyên môn của bạn báo hiệu “có gì đó sai”, hãy kiểm tra lại.

Ví dụ: AI nói “tỷ lệ lạm phát Việt Nam năm 2025 là 12%”. Nếu bạn theo dõi kinh tế, bạn sẽ biết ngay con số này bất thường và kiểm tra lại sẽ phát hiện đó là hallucination.

4. Chia nhỏ câu hỏi phức tạp

Tỷ lệ hallucination tăng theo độ phức tạp của prompt. Thay vì hỏi một câu hỏi lớn bao trùm nhiều khía cạnh, hãy chia thành nhiều câu hỏi nhỏ, mỗi câu tập trung vào một khía cạnh cụ thể.

Cách hỏi	Rủi ro hallucination
❌ “Phân tích toàn bộ tình hình tài chính Việt Nam 2025, so sánh với khu vực, và đề xuất chiến lược đầu tư”	Cao – quá nhiều khía cạnh, AI dễ bịa số liệu ở phần nào đó
✅ “GDP Việt Nam năm 2025 là bao nhiêu? Nguồn từ Tổng cục Thống kê hoặc World Bank.”	Thấp – cụ thể, kiểm chứng được ngay

5. Áp dụng nguyên tắc “Human in the Loop”

Human in the Loop (con người trong vòng lặp) là nguyên tắc: mọi kết quả AI tạo ra phải được con người kiểm tra và phê duyệt trước khi sử dụng chính thức, đặc biệt trong các quyết định quan trọng.

Quy tắc thực hành:

Rủi ro thấp (draft email nội bộ, brainstorm ý tưởng): Kiểm tra nhanh trước khi gửi
Rủi ro trung bình (báo cáo, phân tích, nội dung marketing): Kiểm tra kỹ + đối chiếu nguồn
Rủi ro cao (hồ sơ pháp lý, quyết định tài chính, dữ liệu y tế): Bắt buộc kiểm tra bởi chuyên gia, không dùng AI làm nguồn duy nhất

Prompt Engineering: “Phòng bệnh” tốt hơn “chữa bệnh”

Phát hiện hallucination là cần thiết, nhưng phòng tránh còn quan trọng hơn. Và cách phòng tránh hiệu quả nhất chính là viết prompt đúng cách. Một prompt tốt giúp giảm hallucination bằng cách:

Kỹ thuật	Cách áp dụng	Tác dụng
Cung cấp bối cảnh rõ ràng	Nêu ngành nghề, đối tượng, phạm vi thời gian	AI không phải “đoán” bối cảnh → ít bịa
Giới hạn phạm vi	“Chỉ dựa trên thông tin từ báo cáo đính kèm”	AI không tự thêm thông tin ngoài nguồn
Yêu cầu trích dẫn	“Mỗi số liệu kèm nguồn cụ thể”	Buộc AI phải “minh bạch”, dễ kiểm chứng
Yêu cầu thừa nhận giới hạn	“Nếu không chắc chắn, hãy nói rõ”	Giảm hiện tượng AI “đoán bừa”
Chia nhỏ tác vụ	Mỗi prompt một nhiệm vụ cụ thể	Giảm độ phức tạp → giảm hallucination

Ví dụ prompt phòng hallucination:

“Dựa trên báo cáo đính kèm, tóm tắt 3 điểm chính về doanh thu Q4/2025. Chỉ sử dụng dữ liệu có trong báo cáo, không thêm thông tin bên ngoài. Nếu báo cáo không cung cấp đủ dữ liệu cho điểm nào, hãy ghi rõ ‘Không đủ dữ liệu trong báo cáo”

So sánh với prompt thông thường:

“Phân tích doanh thu Q4/2025 giúp tôi”

→ AI có thể tự thêm số liệu, so sánh, dự báo, tất cả đều có nguy cơ hallucination.

AI Hallucination trong tương lai: Có hết được không?

Câu trả lời ngắn: Không (ít nhất không trong tương lai gần).

Theo phân tích từ ScottGraffius.com (2026), hallucination đang giảm dần trên các tác vụ đơn giản: từ 1–3% năm 2024 xuống 0,7–1,5% năm 2025 trên benchmark tóm tắt có nguồn. Tuy nhiên, với các tác vụ phức tạp (suy luận nhiều bước, trả lời câu hỏi open-domain), tỷ lệ vẫn dao động 3%–20% hoặc cao hơn theo đánh giá của Stanford HAI (2025).

Các kỹ thuật giảm hallucination đang được phát triển bao gồm:

RAG (Retrieval-Augmented Generation): AI truy xuất dữ liệu từ nguồn xác minh trước khi trả lời
Reinforcement Learning from Human Feedback (RLHF): Huấn luyện AI “biết từ chối” khi không chắc chắn
Grounding: kỹ thuật buộc AI tạo câu trả lời dựa trên dữ liệu thực tế đã được xác định trước, thay vì dựa vào “trí nhớ thống kê” chung của mô hình.

Nhưng bản chất của LLM là dự đoán xác suất, không phải hiểu sự thật, đồng nghĩa với việc hallucination là đặc tính cố hữu, không phải bug có thể sửa hoàn toàn. Điều này càng nhấn mạnh tầm quan trọng của kỹ năng con người trong việc kiểm soát và kiểm chứng AI.

Xây dựng kỹ năng phát hiện AI Hallucination bắt đầu từ đâu?

AI Hallucination không biến mất, nhưng bạn hoàn toàn có thể học cách nhận diện và kiểm soát nó. Đây là kỹ năng thuộc về AI Literacy – khả năng sử dụng AI hiệu quả và có trách nhiệm.

Khóa học Practical AI Literacy của UniTrain dành riêng Module 2 – “Brainstorm, Research & Insight Extraction” để trang bị cho bạn:

Kỹ năng Chat with PDF: Trích xuất thông tin từ tài liệu dài, giảm hallucination bằng cách giới hạn nguồn dữ liệu cho AI
Kỹ thuật tổng hợp và kiểm chứng: Phát hiện khi nào AI đang “tự tin nhưng sai”
Phương pháp phát hiện AI Hallucination: Thực hành với các tình huống thực tế trong công việc

Ngoài ra, Module 1 (Prompt Engineering) giúp bạn viết prompt phòng hallucination từ gốc, và Module 6 (Responsible AI) trang bị tư duy “Human in the Loop” – kiểm soát AI thay vì bị AI kiểm soát.

Follow UniTrain để cập nhật thêm nhiều kiến thức hữu ích khác bạn nhé.

XEM THÊM

[Khóa học] Practical AI Literacy

[Kiến thức hữu ích] Prompt Engineering trong tài chính: Cách dùng AI hiệu quả cho phân tích và ra quyết định

[Kiến thức hữu ích] So Sánh Các Công Cụ AI Cho Dân Tài Chính: ChatGPT, Claude, Gemini, Perplexity hay Copilot?

Bài viết

AI Hallucination là gì? Cách phát hiện và tránh bị AI “bịa” thông tin

AI Hallucination là gì?