自然言語処理の訓練時のデータセットで、
最もサイズが大きくなるのがone-hotの教師データというのは普通?
時系列の教師データをラベルの配列で保持して、
訓練時のみラベルをone-hotのデータに変換できればメモリを節約できるのに