読み上げ音声が長いからそれで容量食ってねえか
認識部分が3つもあるし