そして、"外部からの報酬(extrinsic rewards)"なしで訓練されたAIモデルがスキルを身につけたり、学ぶことができることを示した。
Large-Scale Study of Curiosity-Driven Learning
https://www.youtube.com/watch?time_continue=85&;v=l1FqtAHfJLI
>AIに様々なゲームをさせてみた
>何をするのか、勝つという意味がなんなのか教えていない
>ノーゲームスコア、ノーゴール、ノー報酬(外部からは無報酬)。あるのは”好奇心”のみ
>スーパーマリオではレベル10に達した
>なかなかいいプレイをしている。さて、もう一つAIを敵対的に(対戦で)加えたらどうだろう
>うまくラリーしてる
>ロボットでシミュしてみよう
>蟻ロボットに歩行のような行動が見られる
>Curious agent(好奇心旺盛なAI)は、遠くの目的地までたどり着く手段を学べる
>好奇心で離散した複数の目的地もカバーできる
>Curious agentはハマる(詰まる)ことはあるだうか?
>テレビとリモコンを渡したら、だらだら居座り続けた
>チャンネルを変えることに興味があるらしい

要するに、AIに特定のゴールを教えずに物事をやらせる方法を編み出したということだ。
ホワイトペーパーによると:”これは聞こえるほど不思議なことではない。
発達心理学者にしてみれば内発的動機づけ(好奇心など)は初期の発達において主要な原動力と位置付けている:乳児は目的なき探索を用いることにより、その後必要なスキルを身に着ける。
マインクラフトをプレーして、そこで外的な報酬がなくても近くの動物園(local zoo)に訪れたり、他にもたくさんの例がある。”