最近の面白い話題として松尾氏が紹介したのが、シミュレータ上で環境とエージェントが対立して戦う「Robust Adversarial Reinforcement Learning」である。
環境側は、エージェントに与えられたタスク(あっちの方角に歩いていくなど)をさせまいとして、横から押して転ばせようとしたりする。
こうして強くなったエージェントを実世界に出せば、順応性が上がる。


なーんか軍事転用できそう・・・