【財新網】隨著人工智能技術的發展,AI幻覺問題也日益受到關注。2025年兩會期間,全國人大代表、國內人工智能企業科大訊飛的董事長劉慶峰建議,應預防大模型生成“幻覺數據”充斥互聯網帶來的危害,從技術研發和管理機制上構建可信的信息環境。
AI幻覺(AI Hallucinations)指的是大模型時常胡編亂造,而且有時候編得足以以假亂真,或者出現“AI 運算偏差”,產生與真實世界不一致的內容。
一項最近更新于2月11日的測評顯示,DeepSeek R1的幻覺率為14.3%(平均總結長度77.1個詞),相對較高,DeepSeek -V3的幻覺率則為3.9%(平均總結長度88.2個詞)。測評的所有模型中,表現最佳的是Google Gemini -2.0- Flash -001,幻覺率只有0.7%(平均總結長度65.2個詞)。同樣是國產模型的智譜Zhipu AI GLM -4-9B- Chat 幻覺率為1.3%(平均總結長度58.1個詞),GPT -4o的幻覺率則為1.5%(平均總結長度77.8個詞)。



















京公網安備 11010502034662號 