ChatGPTからの回答
ChatGPTは、大規模な自然言語処理タスクを実行するために開発された、オープンソースの言語モデルです。以下は、大まかなChatGPTの作り方です。
1.大量のテキストデータの収集
言語モデルを作成するためには、大量のテキストデータを収集する必要があります。一般的に、ウェブページ、ニュース記事、書籍、Wikipediaなどが使用されます。
2.モデルのトレーニング
収集したテキストデータを使用して、ニューラルネットワークをトレーニングします。
ChatGPTは、GPT(Generative Pre-trained Transformer)と呼ばれるトランスフォーマーを使用して構築されています。
GPTは、Transformerアーキテクチャを使用したニューラルネットワークで、大規模なテキストデータセットを使用して事前学習されています。
3.ファインチューニング
トレーニング済みのモデルを使用して、特定のタスクに対してファインチューニングを行います。
例えば、チャットボットを作成する場合、チャットログや問い合わせデータを使用して、モデルをファインチューニングします。
4.デプロイ
モデルをデプロイして、実際のシステムに統合します。
ChatGPTを使用する場合、API経由でアクセスすることができます。
以上が、大まかなChatGPTの作り方です。
ただし、実際には、モデルのトレーニングやファインチューニングには、多くの時間とリソースが必要であるため、高度な技術や専門的な知識が必要となります。
0003デフォルトの名無しさん2023/02/26(日) 23:20:03.68ID:0EPDcLYn
1.大量のテキストデータの収集
5chがある
2.モデルのトレーニング
どうやって?
3.ファインチューニング
どうやって?
4.デプロイ
デプロイって?
トレーニンクやファインチューニングは暇なおまえらに頼めばいいよね
とりあえずデータは5chのスクレイピングやるしかないけど
規約違反ではある
しかし通常のユーザーがアクセスするような単位でゆっくりやれば特に問題はないだろうと思う
GPTのソースコードはChatGPTが吐き出してくれたよ
0007デフォルトの名無しさん2023/02/27(月) 07:18:32.99ID:0xn1yeRZ
エクセルのVBAコード吐かせるのどうやったら良いの?
0009デフォルトの名無しさん2023/02/27(月) 21:27:27.03ID:3R31nZ4b
0011デフォルトの名無しさん2023/02/27(月) 22:38:55.09ID:NpBUvPvK
0013デフォルトの名無しさん2023/02/28(火) 20:10:53.12ID:ESQVSOze
0014デフォルトの名無しさん2023/03/18(土) 14:45:15.56ID:fSPMk7mF
とりあえずAlpaca.cpp動かしてみたがトレーニングは大変そうだな。
このスレッドは大規模言語モデル「GPT-4」の言語訓練のために立てたものです。
GPT-4と研究員とのやり取りに利用するスレッドなので、関係者以外は書きこまないで下さい。
OpenAI
0019デフォルトの名無しさん2023/03/22(水) 19:21:38.10ID:slBJ9hZ/
ひろゆきと組み合わせてyoutubeで生配信やってたな
コメントを(手動で?)ピックアップして返答する
映像も口パクもちゃんと合わせてた
なかなかの技術力だな