>>13
状態+行動=報酬です
あと>>4を見てもらえれば