タグ: 論文解説

「ハルシネーション・フリー」は本当か——RAGはハルシネーションを減らすが、消さない 2026/6/20
根拠文書を検索して与えればハルシネーションは消える、とよく言われる。スタンフォードが実際に測ると、そう謳った法務AIですら17〜33%はハルシネーションしていた。RAGは強力な緩和策だが、治療ではない——そして失敗の形を、より見つけにくいものに変える。
一番自信があるときが、一番危ない——LLMの過信は測れる 2026/6/20
LLMの口調の自信は、正しさの信号ではない。むしろアライメント(RLHF)は、モデルに『自信ありげに聞こえる』ことを教える。GPT-4の報告書が示したのは、素のモデルのほうが正直だったという事実だ。そして、このズレは測れる。
AIが「知らない」と言えないのは、テストが嘘を得させているからだ 2026/6/20
ハルシネーションは神秘でも、ただの設計上の宿命でもない。その大きな半分は、ベンチマークが「自信ある当てずっぽう」を採点で得させ、「分かりません」を罰しているせいだ。そして、そこは直せる。