Absolute Zero Reasoner (AZR)
自律的に学習し推論するAIモデル
人間が用意したデータ(外部データ)を一切使用せずに、自己学習と自己対話(セルフプレイ)を通じて推論能力を向上させる
https://arxiv.org/abs/2505.03335
https://chatgpt.com/share/681b9348-d300-8006-be3c-57cad8c52357

AlphaZeroに似たコンセプトだが、違いは…
AlphaZeroはゲームルールに基づく固定タスク(チェスや囲碁)で学習
AZRは、タスク自体を自己生成し、問題も解決方法も自ら設計