ハルシネーションは間違えることにペナルティが無いから起こるという説があって(AIが分からない表明する利点がないから捏造でも一か八か正解だと思わせようとする)
間違えたら仮想的な痛みを与えることによって抑制しようという怖い手法があるとか