初期のGTP3.5が内部仕様についても教えてくれていた頃に
保持している大量のテキストデータから質問に関連した出現率の高い単語が
最も正解の確率が高いとして、引っ張って来てそれらを自然言語処理に投げてるとか。
今は私はオープンソースではないので答えられない的な事を言われる。
テキストデータも生データで一部見せてと言えば貼ってくれてた