Transformerって完全パラレル計算なの?
chatgptは2048文字とかパラレル?

LSTMみたいに順次計算とは違うの?