SGDって単純な方法で最適化理論で扱われるようなものではないですよね。