>>216
論文見てもわからんよ
詳しい説明書いてないから
実際のコードを読むしかない
これが本家のモデル
他のゼロから作る系は間違ってる可能性あるからこれを読むべし
tf1で実装されているのが非常読みにくいが仕方ない
https://github.com/openai/gpt-2