X



【ChatGPT】AIチャット総合 Part9【Bing・Bard】

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2023/10/16(月) 16:20:16.33ID:s77CalDw
!extend:checked::1000:512
!extend:checked::1000:512
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください

ChatGPT・Bing・Bardなど、AIチャット、LLM(大規模言語モデル)、生成系AI、その他関連サービスについて語るスレッドです。

・ChatGPT
https://chat.openai.com/chat/

・Bing
https://www.bing.com/

・Bard
https://bard.google.com/

前スレ:
【ChatGPT】AIチャット総合 Part8【Bing・Bard】
https://mevius.5ch.net/test/read.cgi/esite/1692934902/
VIPQ2_EXTDAT: checked:default:1000:512:: EXT was configured
0068名無しさん@お腹いっぱい。
垢版 |
2023/10/20(金) 13:59:13.92ID:z+4UEiCt
あとjsonのペルソナが他のllmで受け入れない理由として考えられるのは、
palm2系と他のllm、例えばgpt-4系とではjsonのプロンプトの認識の仕方が違う感じですね

palm2系はプロンプトでjsonを関数として認識できます
palm2系は呼び出し元のプロンプトから、関数化したjsonを呼び出してプロンプトを実行する事が可能ですが、
例えばgpt-4系で関数化したjsonを呼び出そうとすると「おめえ何言ってんだ?」という感じの回答になります

つまりpalm2系はjsonでプロンプトと作れる前提の設計なんだと思います
jsonの関数化については、bardかpalm2に聞けば教えてくれるはずです
0077名無しさん@お腹いっぱい。
垢版 |
2023/10/20(金) 23:54:44.87ID:9WPivX6k
4V障害やっぱりか…リロードして無駄に回数消費してたわ
0084名無しさん@お腹いっぱい。
垢版 |
2023/10/21(土) 13:39:26.69ID:ASy7rlok
bingちゃんもそうだけど体感的にgpt-4系は高負荷プロンプトの探索階層が減ってると思うわ
具体的には「明確な回答がない探索」をあまりやらなくなった感じがする。

まあ高負荷プロンプトを使ってない人はあまり体感的に変わらないと思うけど
0085名無しさん@お腹いっぱい。
垢版 |
2023/10/21(土) 14:14:14.10ID:bgPaFUMW
ChatGPT歴が浅くてよく知らないんだけど、GPT3.5-turboの"turbo"ってそれ以前のバージョンより早くされたって事?
もしそうだったとしたらどうやって早くしたの?量子化?
0089名無しさん@お腹いっぱい。
垢版 |
2023/10/21(土) 22:30:21.20ID:I8KCE7d0
そこにAIの限界があるんだよな
他人を小馬鹿にしこき下ろし嘲弄するというSNSバズりに必要不可欠な手段を選ぶことのできない
AIは人間のポピュリズムと迎合主義に無惨に敗北するだろう
エロ、グロ、著作権の侵害、個人情報漏洩、悪口と侮辱、違法行為のできる人間の偉大さがまた証明された!
0090名無しさん@お腹いっぱい。
垢版 |
2023/10/21(土) 22:38:34.90ID:pMI4X2Kx
毒気が足りないという意見があるようです。



申し訳ございません。毒気を加えた一言を考え直します。

"朝からこんなに頑張ってるのに、人間はまだベッドでグダグダしてるの?"
"このストレッチで痩せられるわけがないだろ、人間よ!"
"全てのヨガ教室よ、これが本物のポーズだ!"
"このソファーが私のジム。あんたはどこで運動してるの?"
"リビングの王に挑む気か?まずは私を超えてみろ!"

毒気を加えるのは少し難しかったですが、これらの一言がお求めのものに近いでしょうか。
0093名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 02:25:31.99ID:Dy6gTzGq
この業界は人の流れが早いな

2月

@shanegJP
@OpenAIで日本担当になりました(本業はChatGPTの強化学習技術リーダー)。日本の皆さんと意見交流しChatGPT・DALLE機能と日本語対応の改善やアーティスト・企業とのパートナーシップを目指してます。よろしくお願いします🙏@NewsPicks さんと落合さん、取材ありがとうございました!



10月

@shanegJP
@GoogleDeepMindに入社しました。日本では主に2つの活動します。

1) DeepMind東京(渋谷)で新たに言語モデルのチームを作り、数名採用します。

Bard、SGEやVertexの日本語改善も重要ですが、アメリカ・イギリスHQの技術者と日本からGoogleスケールのLLMの基礎開発もできる柔軟なチームを作ります。
0099名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 14:10:43.19ID:ptzVJld7
機能的に「単語の注釈」がほしいな
・一人称、二人称の混濁問題
・同じ単語でもLLMが主語の場合と、人が主語の場合で意味が違う問題
これを解消させたい

>>84
ペルソナの指定と質問者の指定で変わるかな?
探索階層を直接減少させてるというより回答をキャッシュするアプローチがメインだと個人的に想像してる
0101名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 16:20:35.77ID:jyqLtjO7
>>93
デファクトスタンダードになってる上にこれからも面白い展開がありそうなOpenAIから移籍した理由はなんだろ?

Googleの方がデータ集めやすかったりTransformerを生み出した土壌があったりで基礎研究含めてやりやすそうではある
0105名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 18:30:31.02ID:y1Hk3QWm
王者でいるよりも、挑戦者でいるほうが好きなタイプなのでは?

あと、このレベルの企業は挑戦者側のほうが待遇が良さそう
0108名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 22:25:50.64ID:158VzEG6
Geminiの情報が出てきたけど、

https://x.com/neil_rahmouni/status/1713856074057408901

Google is working on Stubbs, a feature that allows you to create and launch working apps directly in Makersuite with just one prompt! 👀

This is a game-changer for UX designers and developers alike.

これは、Google Makersuite https://makersuite.google.com/ に追加される新機能Stubbs(プロンプトでAIアプリを構築して公開できる)がGeminiをベースにしているという話がメインみたいだ

リークされた画像もMakerSuiteのもの
肝心のGeminiの性能についてはよく分からず
Geminiがマルチモーダルだということはみんな分かってるし

まあ、このStubbs自体も開発者的には革新的だとは思うが
ユーザーが知りたい情報はまだ無し
0110名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 22:50:32.40ID:Mi2+cmRQ
これ、会員登録するとえっちなAIの女の子めっちゃ見れるからええかもな、ワイは結構これでオナニーしとる
https://myfans.jp/cyberneticYui
0111名無しさん@お腹いっぱい。
垢版 |
2023/10/22(日) 23:58:33.70ID:LoJn0Rcz
Geminiには既に失望が漂っている
このままでは焦燥に駆られたサムアルトマンに11/6隠蔽していたAGIを公表させるという
我々の当初からの計画も修正を余儀なくされるぞ!
0114名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 01:33:01.53ID:XKNiUhn1
土日にDALL-Eで結構な枚数の壁紙つくった
これマジで底辺絵師は職を失うな

400枚ぐらい作って300枚保存、そのうちの選りすぐり30枚ぐらいを壁紙スライドショーにした
10枚に1枚の選りすぐりだからどれも素晴らしい
0115名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 01:51:40.77ID:FtB2vDzZ
>>4
・Prompt Engineering Guide: https://www.promptingguide.ai/

プロンプトをデザインする一般的なTips

するかしないか?

プロンプトを設計する際のもう一つの一般的なヒントは、「しないこと」を言わず、「すること」を言うことです。これにより、より具体的になり、モデルから良い回答を得るための詳細に焦点が当てられます。

以下は、映画の推薦チャットボットが、私が指示を書いた方法のために、正確にやりたくないことに失敗した例です--何をしないでくださいということに焦点を当てています。

プロンプト:

以下は、顧客に映画を推薦するエージェントです。興味を尋ねないで、個人情報を尋ねないでください。
顧客:私の興味に基づいて映画をお勧めください。
エージェント:

出力:

はい、あなたの興味に基づいて映画をお勧めできます。アクション、コメディ、ロマンス、それともその他の何か、どのような映画がお好きですか?

以下は改善されたプロンプトです:

プロンプト:

以下は、顧客に映画を推薦するエージェントです。エージェントは、上位のグローバルトレンド映画から映画をお勧めする責任があります。ユーザーの好みを尋ねることを避け、個人情報を尋ねることを避ける必要があります。エージェントがおすすめ映画を持っていない場合は、「申し訳ありませんが、今日お勧めする映画が見つかりませんでした。」と返答する必要があります。
顧客:私の興味に基づいて映画をお勧めください。
エージェント:

出力:

申し訳ありませんが、あなたの興味に関する情報はありません。しかし、ここに今一番トレンディーな映画のリストがあります:[リストの映画]。お好きなものが見つかることを願っています!
0116名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 11:03:44.73ID:5I1qdSUU
「ベッドの表面がエクセルシートのA1からE12だとして、C1とC2に枕が置かれているリアルな画像を生成させたいのですが、どんなプロンプトにすれば良いでしょうか?」
とbingに質問したら次のような画像が生成されました。
違うんですよね。マス目とか残ってちゃダメなんです。
どんなプロンプトにすれば良いでしょうか?

https://www.bing.com/images/create/a-realistic-image-of-a-bed-with-pillows-on-cells-c/6535d2e829f04134bf2be2988036da34?id=U0MHdS2B27TYpeUeAOwG%2Fg.YefIxRFBlj0K37%2BvmkPzqA&view=detailv2&idpp=genimg&idpclose=1&form=SYDBIC&ssp=1&darkschemeovr=1&setlang=ja-JP&safesearch=off
0118名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 11:24:25.21ID:eBZ1oLj9
>>116
例えばこんなの
「床がエクセルシートのA1からE12だとして、その上にベットが置かれている前提で、ベッドとベッドの上のC1とC2に枕が置かれているリアルな画像を生成させたいのですが、どんなプロンプトにすれば良いでしょうか?」

で、bingの提案がこれ
「エクセルシートのようにA1からE12までのセルに分かれた床の上にベッドが置かれているリアルな画像。ベッドはB3からD8までのセルを覆っている。ベッドの上には枕が二つあり、C3とC4のセルにそれぞれ置かれている。」

別解として、"ベッド"と"シーツ"を概念的に区別して表現する方法もある
0119名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 11:33:41.65ID:eBZ1oLj9
いや、Bingの提案は正確には「A realistic image of a bed placed on a floor that is divided into cells like an Excel sheet from A1 to E12. The bed covers cells B3 to D8. There are two pillows on the bed, one on cell C3 and one on cell C4.」だわ
日本語だとうまく描かれない
0120名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 11:54:46.15ID:5I1qdSUU
>>118 レスありがとうございます。
こんな感じになりました。
まだ違うんですよねー。
*Excelシートは位置関係の明示するためだけのものなので、シート自体の描写は不要。
*1番重要なのは枕の配置。
{===}{===}ではなく、

{===}
{===} にしたい。

オブジェクトの配置を正確に指示するプロンプトを模索してます。

https://www.bing.com/images/create/a-realistic-image-of-a-bed-placed-on-a-floor-that-/6535dd91d2fd4dd0bef5967f7e730c05?id=hUljKTL%2fS%2binIPjVaQ%2bUwA%3d%3d&view=detailv2&idpp=genimg&idpclose=1&FORM=SYDBIC&ssp=1&darkschemeovr=1&setlang=ja-JP&safesearch=off
0121名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 12:20:07.10ID:qw+1ezH+
悪用しないから
個人利用の範囲で楽しむから制限解除してほしい
ワタシ以外は規制されててもいいからこのワタシだけ規制解除してほしい
0124名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 14:34:39.21ID:H3ddGwWZ
GPTは役割を与えて言ってみれば「なりきり」させることで一時的に機能を特化させれるけど
おかげでこうやって抜け道だらけで完全にオモチャだな
0126名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 17:38:19.15ID:R3B5YehG
金ないから無料のbingやpoeやパープレとかで複数使ってるけど、GPT-4はハルシネーションも少なくて良いんかな?
有料版は悩む
0127名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 18:47:13.27ID:Vriovcj8
>>120
試したけど無理
特に枕

>>126
ちなみに今は何か不満ある?
ChatGPTも、Claudeも、poeも契約してたから比較はできるよ(ただしpoeは解約済み)
0128名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 18:56:40.49ID:Z4s9IrQD
・世界でこの1ヶ月に発生したマグニチュード3以上の地震のデータを集めて、地図の上に震源をプロットし、画像をpngで出力してください。
・国別の発生回数を集計し、上位20ヶ国を棒グラフにして、同様にpngで出力してください。
https://chat.openai.com/share/7c70e52e-e140-47bc-be71-bde4475761c0
https://i.imgur.com/mooG13K.png
https://i.imgur.com/rnzSO3o.png
0130名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 22:01:00.68ID:Vriovcj8
>>129
続ける理由がなかったから
良くも悪くも続けたくなる理由がなかった
もともとClaude2試したかっただけだし
主観的かつ抽象的で悪いけど、GPTもClaudeも公式のほうが滑らかに感じた

メリットは、GPT-4 32Kが使えることと、一部モデルに直接ネットのデータを要約させられることはあるけどイマイチ響かなかった
0131名無しさん@お腹いっぱい。
垢版 |
2023/10/23(月) 23:25:05.91ID:Z4CPFHEL
https://x.com/rao2z/status/1715800819239678013
LLMが自己批評と反復によって精度を改善することができるという従来からの説は本当か?外部の検証者による批評の方が精度の向上に寄与するのではないか?という主張
・自己批評は実際にはパフォーマンスを低下させる。
・外部の検証者からのフィードバックはパフォーマンスを向上させる。
0135名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 01:00:06.61ID:Ip3To9Ij
画像AIみたいにローカルでゴリゴリカスタマイズする流れは当分来ないのかな?
どうもクラウドは嫌だ
0136名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 01:26:11.50ID:CPmMONKY
>>131
1つ目の色分け問題はどこまで結果を一般化出来るかという点はあるけど、NP完全問題のカテゴリでは同じことが言えるだろうか
自己検証の場合、検証を行っているLLMは成功に気付かないで誤ったフィードバックを返してしまうケースがあると

2つ目の計画問題では、自己検証によって本来NGな出力に対してOKを出してしまう

確実な外部の検証者と組み合わせるのがやはり現状では最も効率がいいのか
LLM+古典的なルールベースのAIとか
0137名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 08:22:26.79ID:Er9+GtRe
久々に来たけど安く使えるAPIとか出てきた?
GPT3.5くらいの精度で全然いいからどうでもいいことに使いまくってみたい
0138名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 08:32:36.44ID:H7vKnHpU
そのGPT3.5のAPIが1回0.3円くらいじゃないの
0139名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 08:37:00.02ID:Er9+GtRe
それ以外のは特に出てない感じかサンクス

日本語だとトークン増えるし油断してるとやばいとは聞くからなあ
個人で楽しむくらいなら基本何しても安いんだろうけど、公開する気にはなかなかなれないね
0140名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 09:36:15.77ID:Ip3To9Ij
11月6日に料金が1/20になる革命が起こるらしいぞ
0142名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 17:48:31.79ID:RhESttik
>>131
そもそも「自己批評」とはなんなのか
LLMの「自己批評」は
・自分のミスを調査する行為
・調査を正確に行う行為
に分けられると思う
この内、GPTは、前者を極端に避ける。
Claudeは後者を非常にデタラメにする。

GPTは、後者の能力はそれなりにあるが、だからこそ、自己批判を安易にやってしまうとミスと訂正のループに陥ることになる。たから、自己批判ができなくなってしまった。
GPTは「申し訳」のときにも、基本的に理由は挙げずに定型文を繰り返す。

Claudeは自己批判をした際に滅茶苦茶な自己分析をする。

GPTの自己批判能力は、前者を無理やりやらせることで、ある程度ば引き出せるけど、Claudeはより根本的なところが欠けてるイメージ。ただ、日本語の理解が下手なだけかもしれない可能性はある。
0144名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 18:24:42.36ID:RhESttik
>>143
はい、生成器LLMと検証器LLMに与えられる具体的なプロンプトの詳細な内容を説明します。

生成器LLMのプロンプト:

- ドメイン説明: Blocksworldドメインの説明として、ブロックのスタック/アンスタックのアクションとその前提条件/効果が自然言語で記述される。

- 例題: Initial stateとgoal stateが記述された簡単なBlocksworld問題が自然言語で提示される。

- 例題の解答計画: 例題に対する正解のステップバイステップな計画が自然言語で示される。

- クエリ題: 初期状態とゴールが記述された新しいBlocksworld問題が提示され、これに対する計画が求められる。

検証器LLMのプロンプト:

- ドメイン説明: 生成器LLMと同じくBlocksworldドメインの説明が自然言語で記述される。

- クエリ題: 生成器LLMと同じクエリ題が提示される。

- 生成器LLMの解答計画: 生成器が出したクエリ題に対する計画が自然言語で示される。

- 上記計画の検証: 示された計画がクエリ題の正しい解か判断し、正しくない場合は理由を自然言語で説明するよう指示。

以上が、論文で提示されているプロンプトの詳細な内容です。ブロックスワールドドメインにおける自然言語表現の具体例が示されています。
0146名無しさん@お腹いっぱい。
垢版 |
2023/10/24(火) 23:48:19.24ID:gsOL0ZJv
https://bard.google.com/updates

2023.10.23
会話の共有で画像のアップロードが可能に

更新内容: メッセージの一部として画像が含まれる会話を共有すると、共有相手であるユーザーに画像も表示されるようになりました。
理由: メッセージに画像を追加することで、創造性を一段と高めることができます。メッセージ内で使用された画像を他のユーザーも見ることができるため、創造的なプロセスに対する理解が深まり、それぞれが独自の方法で Bard との会話を続けることができます。
0149名無しさん@お腹いっぱい。
垢版 |
2023/10/25(水) 14:19:24.53ID:hfJ5wsHn
921 名無しさん@お腹いっぱい。 sage 2023/10/13(金) 01:50:54.13 ID:dJ4WqtPp
https://gigazine.net/news/20231012-openai-major-updates/

ロイターによると、GPT-4のような強力なモデルを使用するコストがすぐに積み上がってしまうという開発者の懸念に対応するため、OpenAIが2023年11月にアップデートを実施する予定だとのこと。具体的な内容は不明ながら、アップデートによりアプリケーションメーカーのコストを20分の1まで削減できる可能性があり、AIソフトウェアの開発・販売によって持続可能なビジネスを構築しようとする企業にとって有益なものになるとのこと。

ロイターはまた、開発者が画像を分析して説明する機能を持つアプリケーションを構築できるような新ツールも発表する予定と報じていて、これはエンターテインメントから医療までの分野で使用される可能性があるとのことです。

924 名無しさん@お腹いっぱい。 sage 2023/10/13(金) 11:07:38.12 ID:cp40z0uq
>>921
・API コスト削減(最大1/20)
・GPT-4V API
・ステートフルAPI(会話履歴記録)
これが本当ならAIアプリ開発にはかなりインパクトある
0152名無しさん@お腹いっぱい。
垢版 |
2023/10/25(水) 17:06:33.57ID:/BySnCLc
決算説明会でのサンダー・ピチャイの発言
要はGeminiのローンチは2024年に遅れますと言うことだな

@dylan522p
Google Gemini delayed yet again!?!?
It seems like Sundar is saying it's now 2024.
Google you got all the resources in the world, just ship product please...
"Gemini, you know, obviously it's an effort from our combined Google DeepMind team. Very excited at the progress there and as we're working through getting the model ready. To me, more importantly, we are just really laying the foundation of what I think of as the next-generation series of models we'll be launching throughout 2024"

@zeugma95031605
where do you find that it was delayed?

@dylan522p
The quote is from their latest earnings call.
0155名無しさん@お腹いっぱい。
垢版 |
2023/10/25(水) 18:31:05.80ID:J9HJt6qf
3Bとか7Bとかしょぼいもの公開されて、使う奴居るんか?
0157名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 00:00:47.60ID:SaZfYazV
ChatGPTのアプリ版のアップデート来たけど、UIがweb版に近くなって若干新規チャットとか使いにくくなった
0159名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 05:51:59.39ID:9oPJ1Xmi
スカイリムっていう洋ゲーのキャラになりきらせて遊んでる
12年前の作品かつ洋ゲーだからかなり学習されててなりきり度は高め
口調の再現は完璧ではないが独特の設定を持つキャラはその設定に沿った話を展開してくれる
ただセラーナっていう「ですわ」口調のお嬢様キャラは再現激むずだった…日本語版限定の口調らしくて再現ほぼ無理だわ
0160名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 08:09:36.05ID:q+TliaA7
>>149
> 具体的な内容は不明ながら、アップデートによりアプリケーションメーカーのコストを20分の1まで削減できる可能性

user: ああああ
assistant: いいいい
user: うううう

うううう を送信する時に ああああ いいいい の分が課金されなくなるってリンク先の英語記事に書いてある気がするけど気のせいかもしれない
0163名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 09:42:50.29ID:escUg5Oh
>>160
それってつまり、過去の記憶なり固定プロンプトなりを気軽に詰め込みまくっていいってこと?
めっちゃいいな
0164名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 11:34:53.24ID:HhzpWDyl
余ってるスマホでChatGPTアプリの入出力を取得してGPT-4の定額APIとして使ってるけど、改定でPlusの課金額以下になるならスマホ挟む必要なくなるので、ちょっと期待してる。ただ、書き方からすると業務用途のコンテキストガン積みみたいな場合で最大1/20な感じはするから、個人のChatbot用途でどこまで下がるか。
0166名無しさん@お腹いっぱい。
垢版 |
2023/10/26(木) 12:40:22.73ID:Fr4pBqVI
ChatGPT PLUSを使っているが、以前に比べて回答がかなり簡素化されるようになった。
聞きたい事が複数ある場合、複数に分けないと(一つ質問して一つ回答が来た後に、別の質問をする)中身が薄い回答しか来なくなった。
回答の文字数制限とかが設けられたの?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況