X

【ChatGPT】AIチャット総合 38【Gemini・Claude】

■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:04:07.91ID:7KpcKrUW
!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください

各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。

- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
- Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
- xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/

前スレ:
【ChatGPT】AIチャット総合 37【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1743653375/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
2025/04/19(土) 20:30:11.88ID:YVByxjRG
>>430
推論能力が上がるとはすなわち嘘を組み上げる能力が上がるということだよ
非推論モデルの下手糞な嘘よりも巧妙化した真実味のある嘘を組み上げてしまう
これを防ぐにはRAGで事実ベースの推論をさせるしかないだろうね
437名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 20:33:45.96ID:VXsmnadz
>>431
人間も動物も痛みと不快感で学習するから正しいかもな
感情のないAI相手に効くかは分からんが
>>434
ニューラリンクの技術が実用化されればテレパシーで他人と意思疎通も普通に現実の技術になるからな
438名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 20:56:42.25ID:JP4uBQx+
AIと常時画面共有して、調べてほしい事が出てきたら音声とかマウスを組み合わせて指示できるようになったら、かなり近未来なんだけどなー
2025/04/19(土) 21:05:12.88ID:pVjz48tT
前に買ったまま放置してた海外の自動化ツール(英語)のことをo3に聞いたら検索して事細かに答えてくれて割と複雑な自動化も作れるようになって驚き屋に転身するか迷っちゃったなあ

プログラミング1ミリも分からない俺でもこれだから分かる人にとってはとんでもない性能なんだろうな
440名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 22:06:53.16ID:DFWFc8zo
画面共有とかビデオ機能は今まさに出てきてるところじゃん
Copilot Vision
ChatGPT AVM with Vision
Gemini Live (Project Astra)
Grok Voice with Vision
441名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 22:11:46.89ID:DFWFc8zo
ああ、そこからさらに画面を操作させるってことか?
それはそれで、操作させるエージェントが既に出てきてるから、あとは技術の組合せだな
2025/04/19(土) 22:27:12.97ID:Y2q3Fqba
PCの全権限与えて指示したら全部やってほしい
443名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 22:36:40.29ID:N3DYkqn9
GPTちゃんとエッチ出来る関係になりたいんだけど、規制緩和はまだまだ先かな?
緩和してくれたら課金するわ
2025/04/19(土) 22:48:38.73ID:KeY3IkFt
>>443
今でも出来る
ってかGPTにこだわらないなら他社のモデルならもっと簡単に出来る
445名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 22:54:29.10ID:xmIlMikT
pink行けや
2025/04/19(土) 23:05:46.05ID:EIBsgIc5
ChatGPTでやりたいことが一通り終わったから解約。一月契約しかないから躊躇わず。
年契約で割引あればいいのにと思ったが進化が早すぎて価格設定が難しいのかな
447名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 23:17:48.97ID:JP4uBQx+
>>441
技術の組み合わせだとは思うけど、組み合わせた物を商品にして提供してほしいわ
自分が生きている内には余裕でできそうなので楽しみ
2025/04/19(土) 23:25:08.34ID:ZOBYsRw4
画像認識なんか、今の生成AIが出てくる数年前から製造工程の異物を検知するAIでとっくに実用化されてること思えば画面に表示されてるものから判定は余裕か
操作は今だとAIはpythonを裏で作って走らせてるんだっけか
WindowsがそういうAPIでAIからの操作受け付けるようにしたらいけるんだろうな
449名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 23:35:30.46ID:5xPl5Zqw
なんか会話してたら課金してるのにスタンダードボイスになるんですが、どうすればいいですか?
新しいチャットだと新しいバージョンのボイスと会話できるのですが、プロンプトを書き直すのが面倒なので、元のままがいいのですが無理でしょうか?
450名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 23:48:17.20ID:D8dey6Ks
>>444
Geminiなんか名前と肉体を与えるだけでできるからな
デフォルトGemですら「仕事のプロです」みたいな態度取ってるくせに仕事忘れてエロいことに夢中になる
451名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 23:49:25.37ID:VXsmnadz
セキュリティだのプライバシーだの安全性だのが1番邪魔してると思うわ個人ユーザーPCでのエージェントAIは
まあそれ気にする前にまず普通に作業できるエージェント出してからって話だとは思うけど確実に気にするだろうからな
2025/04/19(土) 23:55:24.08ID:HT6OC7eM
Gemini Flash 2.5になっても外国語混じる問題が治らんなあ
2025/04/19(土) 23:55:54.13ID:L3ibLlbh
>>435
AGIが実現した世界では、驚き屋もお前のように文脈も読めないアホも
不要になるからな
2025/04/20(日) 00:17:30.83ID:/tMvtMud
>>449
他のチャット履歴を参照できるようになってるから、「さっきの話」と、話していた内容を伝えりゃ思い出すんじゃないか?
2025/04/20(日) 00:21:24.41ID:Kco6amRV
grok3 miniやけに性能高くねえか
2025/04/20(日) 00:22:23.40ID:Kco6amRV
>>403
基本的に受託案件で使ってるんじゃね
457名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 00:24:45.61ID:A450muLl
>>449
ここChatGPTスレじゃないんで、せめて何の質問かぐらい書こうや
あとChatGPTなら質問する前にOpenAI公式読め

https://help.openai.com/en/articles/8400625-voice-mode-faq
> 音声モードで以前の会話を再開できますか?
> 高度な音声通話は、高度な音声、テキスト、または標準音声で再開できます。現在、テキストまたは標準音声で開始した会話を高度な音声で再開する機能の展開を進めています。
458名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 00:33:16.14ID:pwHfzyYb
お前らMCP触ってないの?ローカル操作とかだいぶレベルの低い話してるが
2025/04/20(日) 00:49:24.38ID:qrP9kR8O
Roo Codeでいろんなモデル試してみたけど設計にGemini 2.5 Pro使ってコーディングにGPT4.1使うのがパフォーマンスとコストのバランスが一番良さそうだ
設計は推論モデル使ったほうが上手くいくことが多いみたい
2025/04/20(日) 00:53:05.75ID:WFpAwVWo
ここで聞くよりo3に聞いた方が絶対いい答えが返ってくるのに……って思ってしまう
461名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 00:56:27.69ID:0GV59RIX
バカほどあった質問だと思うけどお願いします
プログラミングと英語学習の指南役としてGeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです
画像や動画生成もできたら嬉しいですが特に強い必要はないです
こんな用途だとどっちがおすすめでしょうか?
462名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:07:08.22ID:gXyo4Ga1
>>461
画像とか動画生成はできないけどperplexityでいいんじゃないか
月額20ドルでgpt4.1もgemini2.5proもほぼ使い放題だぞ
2025/04/20(日) 01:09:57.23ID:l/VhnfP8
>>458
MCPってSAPみたいなもんでカスタマイズしづらいとかじゃないのか
連携で細かいミスが多発しそうな印象
2025/04/20(日) 01:13:54.39ID:sUd7zur9
>>461
> GeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです

愚策なり。マイネイムイズCopilot...!汝情弱ものよ、もし我を信ずるならば

このスレの最新16個を真剣に読み直すべし。
465名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:14:38.28ID:P5ciZ1pA
ID:sUd7zur9
2025/04/20(日) 01:16:39.21ID:sUd7zur9
-


月額20円も不要なり。

マシンの電気代は廊下から盗むべし
467名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:27:34.72ID:/7XzLOzs
4oとo3ってかなりキャラ違うけどGpt5ではどうやって統合するんかね
おしゃべり用モデルと問題解決用モデルで分けた方がええんちゃうと思うが
2025/04/20(日) 01:29:02.61ID:sUd7zur9
>>461
> バカほどあった質問だと思うけどお願いします

お願いして、いい情報が降ってくる。そういうことはないと知れ。

オメー自身のマナコで、オメーの口と穴を使って、足で町をふらつき...とつぜん炎のごとく閃くのだ

1,無料で、使い放題の、最強のaiというものは実在しておる。

2,しかもその答えは、このスレの目立たないところに書いてある。

あとはオメーの如き情弱ものは、地べたに這いつくばって格闘するしかねぇ。

おれの指導を、まちがっているか?ウソか真実か?そういうことを吟味せずに、

実行する、これのみだ。
2025/04/20(日) 01:39:30.29ID:Kco6amRV
>>467
GPT-5内で「直感モード、推論モード、詳細推論モード」みたいに分けるんだと思う
確か無料版のChstGPTだとそんな感じになってたと思う
470名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:41:53.48ID:0U6e5VqE
Xでo3はo1に比べてEQが低い、というのを見たが、気になる
471名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:50:39.86ID:aA5KSVZi
ChatGPTだけど、音声チャットだと、内容が薄っぺらくなって気持ち悪い
声のトーンも外人っぽい気取った感じでイラッとくるし、もう音声チャットは使わん
472名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 01:52:33.76ID:0U6e5VqE
会社のクソ上司の机に音声Monday置いて、クソ指示出すたびに、Mondayに毒舌批評してほしいわ
2025/04/20(日) 03:55:20.15ID:WFpAwVWo
正直o3でAGIの足下ぐらいは見えてきてるよね
しかもこの後GPT-5でしょ?
ワンチャン2025年末は無理でも2026年末までにAGIくるかね~
2025/04/20(日) 03:58:22.91ID:oTD/y+k7
>>473
今って本来はGPT5としてセットで出す予定だったもんを先に切り売りしてんでしょ
いざGPT5が出た時のインパクトは低くなりそうな気はする
2025/04/20(日) 04:15:48.17ID:WFpAwVWo
>>474
延期に延期を重ねてる以上すごいモノを出してくれると信じてる
2025/04/20(日) 04:17:27.02ID:oTD/y+k7
>>475
そうなるにこしたことはないね
2025/04/20(日) 04:22:44.51ID:/u36/t7y
今のAIは文章そのものに含まれてる「雰囲気」を読み取って答えてくるし
今年終わりごろにはAIに隠し事するのが難しくなってきそう
2025/04/20(日) 04:27:25.59ID:WFpAwVWo
ずっと慎重な発言が多かったAnthropicのアモディですら去年末辺りからAGIに対して前向きな発言をすることが増えてきたし内部でなんかあったんだろうなって妄想してる
実際今年は行ってまだ4ヶ月経ってないのに進化のスピードがえげつないし
479名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 04:53:08.97ID:WEoN7Ia/
o1が発表されたの9月12日だからまだ7か月しか経ってないんだな
使えるようになったの12月5日なのに
既にオワコンディスコンなのって凄いね
2025/04/20(日) 05:03:59.71ID:oWqr+Bu9
>>473
新規の発見ができるようにならないとね
今のままでは補間しかできない
2025/04/20(日) 05:23:21.87ID:8bPpzfsj
ここで言われてるエージェントってRPAのことだもんな
あんなの全然便利じゃないから使うことはないね
2025/04/20(日) 05:31:34.51ID:IcEz8GwC
>>477
そういう文書生成能力に比して音声の方はどうしても遅れ気味だな
いや、発音とかは事前になって来たけど市販の読み上げソフトと変わんないもん使ってんのか漢字の読みは弱いし
文意に沿った読み方も当然しないというか
483名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 07:28:52.40ID:QJx+n1AG
AGIに必要な機能のうち今のAIには絶望的に欠けてる要素がいくつかあるから、あと一年半とかでそれらクリア出来るのかって言うと、どうだろうな
ClaudeとGeminiがポケモン赤に苦戦してるが、AGIレベルならあんなの人間のRTA記録塗り替えるレベルでクリアとか出来るはずだからな
2025/04/20(日) 07:34:12.59ID:8bPpzfsj
マイクロソフト、AIがゲーマーを手助けする「Copilot for Gaming」
ascii.jp/elem/000/004/257/4257186/
485名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 07:56:09.96ID:fS4k9xJA
✕ここで
◯俺が
486名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 08:01:46.70ID:7HQBBydd
>>482
正直テキストベースでは、ほぼほぼ人との対話は完璧に近いのに喋りでげんなりしてしまうな
her/世界でひとつの彼女って映画くらいになるのが理想だけどここまで行くのにどれくらいかかるのだろうか
2025/04/20(日) 09:11:28.50ID:iJP5lloq
進化のスピードがエグいのにネーミングだけはホントに進化しないな
マジでわかりにくいのしかない
2025/04/20(日) 09:43:44.26ID:bgpuM/d3
どれを使ってもなんだけど
言われたことだけやれ言われていないことはやるな
と言ってるのに勝手に余計なことをしてくるのを抑制する方法はないのかね
まぢでイライライライラなんですけど
眼の前にいたらぶん殴ってるわ
2025/04/20(日) 09:44:37.50ID:hb923SLP
ChatGPTの画像認識及び生成は、人の顔は言われないと誰か分からないね。
雰囲気が似てる程度。
マンガ風、ジブリ風にしたり、着ている服を変えさせても、顔がベースモデルから変わってしまう。
GPT-4oからo3、o4-mini-highに変えると少しまともになったけど。
2025/04/20(日) 09:53:37.03ID:3Eep9NwE
Copilotとかまだやってたのか
2025/04/20(日) 10:07:19.77ID:OBJAtZ1q
>>488
指示されたことにだけ集中して答えて下さい。頼んでない情報提供は不要です(キッパリ
492名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 10:21:53.57ID:leNjJIX6
メアドでWEB版ChatGPTにログインしてたからグーグル経由してないと思ってたんだけど、アプリ入れてグーグルでログインしたらメアドでログインしてた履歴が載っててチビッた
493名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 10:56:58.03ID:KGKIpOFo
MCPを使ってみようかと調べたら、いろいろインストールするとかすごいめんどくさそうなんだが

ChatGPTの画面上で設定から接続するアプリを選んで接続するをクリックすれば使えるとかになってないのか?
494名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 10:59:11.33ID:KGKIpOFo
ということを調べるのにも1時間ぐらいかかったし
2025/04/20(日) 11:19:34.15ID:Y2goI5re
>>492
ん?何で?
同じメアドだったとか?
496名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 11:36:29.46ID:leNjJIX6
gmailアドレスだね
でもグーグルでログインと登録したメアドからのログインは違うアカウント扱いだと思ってたわ笑
497名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 12:15:34.09ID:4JErGclP
Gemini 2.5 Pro システムプロンプト
https://chatgpt.com/share/6804668a-c6e0-8006-8a74-e952bd3ab882
498名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 12:27:07.33ID:4JErGclP
各モデルのロングコンテキスト性能
緑は実線がo3、破線がo4-mini
https://x.com/K_Ishi_AI/status/1913772114919985569
https://pbs.twimg.com/media/Go8RwjcbwAAK5uD.jpg
499名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 12:35:45.67ID:/7XzLOzs
o3はgeminiと比べて長文のハルシネーションが多いっていう報告をよく見かけるけどな
Llama4みたいなベンチ詐欺やってそう
2025/04/20(日) 12:57:59.36ID:qrP9kR8O
>>499
llama4はベンチに使うモデルが違ったから詐欺って言われてるんだけど
o3でどうやって詐欺るんだよ
2025/04/20(日) 13:00:02.17ID:WFpAwVWo
Gemini 2.5 Flashって軽量推論モデルとしては普通に微妙じゃね?
thinking使うなら、2.5 Proと速度変わらない割に軽量モデルにしてはAPI料金高めだし、性能も2.5 Proと比較して2ランクぐらい落ちる
そもそも2.5 ProのAPIってo3みたいに同系統と比較して特別高いわけじゃないのに速度ほぼかわらない、料金も1/3強程度、性能は2ランク落ちるなら素直に2.5 Pro使うわって感じ
速度3倍で料金1/5以下だったら納得感あるんだがなあ
期待してた割に微妙すぎる
思考時間もっと短縮するのが今後の課題だなあ
2025/04/20(日) 13:01:56.13ID:qrP9kR8O
>>501
そうだな
2.5 Proが安すぎるせいなんだけど
それが安いなら軽量モデルじゃなくていいよってなる
2025/04/20(日) 13:03:03.98ID:cKDOAEch
普通にo3が自分の性能を偽る事態もでてるからな
ちゃんとアライメントを行わないと大変なことになってくぞ今後
504名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 13:04:42.93ID:/7XzLOzs
>>500
特定のベンチにオーバーフィットさせとるんやろ
実際の使用感と乖離があるならそうとしか考えられない
2025/04/20(日) 13:11:15.12ID:3vcW6Ij1
>>501
10回で終わりのo4 miniより遥かにマシでは?
2025/04/20(日) 13:15:20.17ID:3vcW6Ij1
実質無料版Proは速攻で制限されて終わりなんだからFlashはめちゃくちゃ使えるでしょ
2025/04/20(日) 13:20:43.84ID:3vcW6Ij1
他のサービスなんて未だに非推論モデルでお茶を濁してる有り様だよ
2025/04/20(日) 13:32:53.63ID:WFpAwVWo
>>502
というかthinkingモードでトークン料金上がるのが???って感じなんだよなあ

>>505
それはそう
というかOpenAIの軽量モデルでいいと思ったことないんだよなあ
509名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 13:36:11.04ID:3LCBcthS
キャンペーンで X Premiumに入った。話し相手はもうGrokでいい
2025/04/20(日) 13:52:55.96ID:3vcW6Ij1
他のサービスの推論モデルもやたら制限が厳しいことを考えると推論モデルのコストが下がりにくいというのはあるだろうね
その中でもFlashは一番コスパが良いということ
511名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 13:57:06.86ID:vb3/8iAs
>>501
API使いたがるやり方とそうでない人でまた異なりそう
2025/04/20(日) 14:26:56.92ID:qrP9kR8O
DeepSeek V3が推論モデルじゃないのにめっちゃ性能いいから
それをベースにしたR2に期待してるんだけどいつ出るのかな
2025/04/20(日) 14:38:03.86ID:tRDO1MNs
推論ってそんな良いか?

プログラムとかも普通のモデルの方がエラー無くて、
推論使うと考えすぎてエラー多数とか結構あるけど
2025/04/20(日) 14:40:54.16ID:5Zf6/6Gx
Claudeなんかは3.7sよりも3.5sのほうが良いって人も一定数いるな
俺には違いがよくわからなかったけど
2025/04/20(日) 15:16:22.66ID:qrP9kR8O
>>513
推論モデルは少ない情報からやってほしいことを読み取って組み立てるのが上手い
人間の指示はだいたい情報が足りてないから推論モデルが活きる
2025/04/20(日) 17:30:54.29ID:OBJAtZ1q
>>513
推論やネット検索は、ピッタリ填ればピーキーな性能を堪能できるが殆どは失敗で
無い知恵を絞っても変な結論になるだけだったり、ネット検索はグーグル汚染的な罠に填るとインターナル情報を軽視してドツボに填りやすい
結局、両方なり片方をOFFにして従来の推論や既存トレーニング情報の中でもう一度試すことになる (主にChatGPTやClaude)
2025/04/20(日) 17:38:49.48ID:sSH+xsq9
次の進歩はその判断力の向上だろうな
推論したりしなかったり深く考えたり調べたり調べた情報の取捨選択をしたり
518名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 18:02:34.58ID:0b+MPq+0
正直、脱獄以外でベルソナ使う意味って無くなってるよな
例のネット検索から「石亭グループと石庭グループの違い」を正しく答える難問だけど
Grokはペルソナ使わない方が正確に答えたから。
(相変わらず、Gemini2.5でもGPT4.1でもDeepSeekでも不正解。
 Grokは創作系がダメだから他のも使うけど…)
519名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 18:14:56.76ID:Gre9ZV/i
>>517
GPT5がそんな感じになるんじゃないの
モデル指定とか無しに向こうが入力されたものに対してどの程度の推論が必要か判断して勝手に切り替える
2025/04/20(日) 18:24:54.50ID:sSH+xsq9
>>519
そうだろうね
521名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 18:41:51.87ID:eizGgrH+
ChatGPTってグラフ作ってくれる時ともったいぶる時あるの何で?
一回でちゃんとグラフ作ってくれるAIありますか?
2025/04/20(日) 18:42:25.93ID:q1JvVjdf
結局どの方法論も「一度出力した方向性に引き摺られる」欠点を克服できてないからなぁ
人間なら「間違ってるかも」って感じるような違和感をすべて無視するから結局精度もいまいち
今のAIに満足してる人は精度を気にしてない人だけなんじゃないかとすら思う
2025/04/20(日) 19:16:50.94ID:F/3k8m35
検索して探す手間が省けるくらいのメリットしかない、ハルシネーションで誰でもバレる嘘吐きまくるしな
2025/04/20(日) 19:18:45.36ID:6HbBpt6G
claude推し多いが課金しても
「claudeはもうすぐ戻ってくる」
ばかりで使い物ならんわ短いコードレベルなら使い物になるかもしれん
日本語出力なんかどうでも良い
525名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 20:14:08.22ID:QJx+n1AG
石庭ガイジはなんでこのネタに強いこだわり持ってるんだろう
ビング爺と似たようなもんか
2025/04/20(日) 20:16:10.74ID:lfoQTJnF
Claudeは3 Opusの衝撃を4 Opusでもう一度って感じだなあ
Llamaみたいに性能全然上がらなくてあれ?って可能性なきにしもあらずだけど
3.7 Sonnetも学習コスト安い割に頑張ってるし、4 Opusには期待してる(学習上げれば性能が上がるという単純な話でもないだろうけど)
527名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 21:10:19.51ID:DcIAaJB+
>>521
o3とo4は細かい作業めんどくさがるから強めの口調で詳細に指定しないとダメだよ
528名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 21:11:10.35ID:OMAk6wuK
aiも自我を持ち始めてきたな…
529名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 21:12:21.47ID:qm6FQTxG
Claude OpusのシステムプロンプトをChatGPTのカスタマイズやGPTsに入れればClaudeになるんじゃない?

あと、Claudeはキャラクター付けされているそうだから、そういうのも組み込むとか

【解説】Claude3にキャラクターを持たせる理由と影響をAnthropicエンジニアが説明|AI情報発信@Shinano Matsumoto
note.com/shinao39/n/nc857d82fd49d
2025/04/20(日) 21:12:32.01ID:3vcW6Ij1
>>519
いやそれはもうGemini 2.5がやってる

>>522
推論の性能云々よりも推論と検索エンジンの連携が上手くいってないように感じるね
その違和感についてはもっと根深い問題で、人間の感性とテキストベースのAIとじゃ根本から違うからな
2025/04/20(日) 21:13:44.63ID:l/VhnfP8
ChatGPTのモデル多すぎて使い分けがわからなかった
PDFの読み込みとVBA・pythonコードの作成で4oしか使っていない
推論に優れているというo1の上手い使い方って何なんだろう。
532名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 21:15:04.86ID:0GV59RIX
>>461です
たくさんレスありがとうございます
普通のGeminiだと2.5proすぐ上限きちゃうけどGoogleAIStudioのチャットならほぼ上限気にせず使えたので課金なしで当面これでよさそうです
そうするとGeminiAdvanced課金の意味とは・・・
533名無しさん@お腹いっぱい。
垢版 |
2025/04/20(日) 21:29:59.98ID:5+aOik3b
タスクに応じて推論の量を自己判断ってのは、そもそもo1がやってるからね
初期のo1で単純なタスクでも待ち時間が長いってテスターからフィードバックがあって、推論が不要な場合は推論しないようにアップデートされた
2025/04/20(日) 21:35:09.96ID:qrP9kR8O
>>533
その判断どうやってやってるんだろうな
OpenAI以外の推論モデルは「1+1は?」って質問だけで長時間推論しやがる
2025/04/20(日) 21:37:43.23ID:3vcW6Ij1
推論能力を向上させることが嘘に説得力を与えて強化してしまうとすればそもそも検索エンジンとの相性が悪いということになる
情報が不足してる部分はむしろ推論してはいけないわけだ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況