GPT ってデコーダ層だけでできてるけど
前段のデコーダ層はtransformerのエンコード的に、後段のデコーダ層はデコード的に動いてんの?🤔