数学の問題文に猫の豆知識を混ぜるとAIのエラーが300%増加する
近年の大規模言語モデル(LLM)は、複雑な問題を段階的に解き明かす「推論モデル」の登場により、数学やコーディングの分野で目覚ましい性能向上を遂げています。
しかし、その頑健性、つまり予期せぬ入力への耐性については、まだ十分に解明されていません。
スタンフォード大学やCollinear AIなどの研究者チームが、「数学の問題に全く無関係な猫の情報を挿入することでLLMが混乱する」という研究結果を発表しました。
後略
探検
◆ニュース速報@SF/FT/HR板 Part101
■ このスレッドは過去ログ倉庫に格納されています
263名無しは無慈悲な夜の女王
2025/07/31(木) 12:15:32.66ID:hcebgblR■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【東京】赤坂サウナ火事2人死亡 サウナ室のドアノブ外れ閉じ込められた可能性 ★8 [nita★]
- 中国国防省が再反論 SNSで公開した音声とは“別の通報”で日本に訓練の時間や海域を通報したと主張★3 [夜のけいちゃん★]
- 資さんうどんが「PayPay」の取り扱いを停止 他のキャッシュレス決済は引き続き利用可能 [少考さん★]
- こども家庭庁、2026年から“独身税”を開始、年収200万なら年4200円、年収400万なら年7800円 ★7 [お断り★]
- 【令和】「ゲーム機にスペックは必要かどうか」議論が白熱 ユーザーが実際に求めているものは? [王子★]
- 高市首相「従来の立場超えたと受け止められ反省」 存立危機発言巡り ★4 [蚤の市★]
- 萩生田😤「早期解散したら高市内閣に期待してる国民に申し訳ない。」 [153490809]
- ゆるキャン△のセックス枠
- お前らって口にガムテープ貼られたら死にそう
- 反省ゼロのホモ野郎いい加減にしろよ
- おはようさん!今、fanzaで年末年始50%オフセールやっとるで! [435756605]
- お前らがおっパブに行かなくなってしまった理由
