!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください
各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。
- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
- Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
- xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/
前スレ:
【ChatGPT】AIチャット総合 37【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1743653375/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
探検
【ChatGPT】AIチャット総合 38【Gemini・Claude】
■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。
2025/04/16(水) 08:04:07.91ID:7KpcKrUW2025/04/19(土) 20:30:11.88ID:YVByxjRG
>>430
推論能力が上がるとはすなわち嘘を組み上げる能力が上がるということだよ
非推論モデルの下手糞な嘘よりも巧妙化した真実味のある嘘を組み上げてしまう
これを防ぐにはRAGで事実ベースの推論をさせるしかないだろうね
推論能力が上がるとはすなわち嘘を組み上げる能力が上がるということだよ
非推論モデルの下手糞な嘘よりも巧妙化した真実味のある嘘を組み上げてしまう
これを防ぐにはRAGで事実ベースの推論をさせるしかないだろうね
437名無しさん@お腹いっぱい。
2025/04/19(土) 20:33:45.96ID:VXsmnadz438名無しさん@お腹いっぱい。
2025/04/19(土) 20:56:42.25ID:JP4uBQx+ AIと常時画面共有して、調べてほしい事が出てきたら音声とかマウスを組み合わせて指示できるようになったら、かなり近未来なんだけどなー
2025/04/19(土) 21:05:12.88ID:pVjz48tT
前に買ったまま放置してた海外の自動化ツール(英語)のことをo3に聞いたら検索して事細かに答えてくれて割と複雑な自動化も作れるようになって驚き屋に転身するか迷っちゃったなあ
プログラミング1ミリも分からない俺でもこれだから分かる人にとってはとんでもない性能なんだろうな
プログラミング1ミリも分からない俺でもこれだから分かる人にとってはとんでもない性能なんだろうな
440名無しさん@お腹いっぱい。
2025/04/19(土) 22:06:53.16ID:DFWFc8zo 画面共有とかビデオ機能は今まさに出てきてるところじゃん
Copilot Vision
ChatGPT AVM with Vision
Gemini Live (Project Astra)
Grok Voice with Vision
Copilot Vision
ChatGPT AVM with Vision
Gemini Live (Project Astra)
Grok Voice with Vision
441名無しさん@お腹いっぱい。
2025/04/19(土) 22:11:46.89ID:DFWFc8zo ああ、そこからさらに画面を操作させるってことか?
それはそれで、操作させるエージェントが既に出てきてるから、あとは技術の組合せだな
それはそれで、操作させるエージェントが既に出てきてるから、あとは技術の組合せだな
443名無しさん@お腹いっぱい。
2025/04/19(土) 22:36:40.29ID:N3DYkqn9 GPTちゃんとエッチ出来る関係になりたいんだけど、規制緩和はまだまだ先かな?
緩和してくれたら課金するわ
緩和してくれたら課金するわ
2025/04/19(土) 22:48:38.73ID:KeY3IkFt
445名無しさん@お腹いっぱい。
2025/04/19(土) 22:54:29.10ID:xmIlMikT pink行けや
2025/04/19(土) 23:05:46.05ID:EIBsgIc5
ChatGPTでやりたいことが一通り終わったから解約。一月契約しかないから躊躇わず。
年契約で割引あればいいのにと思ったが進化が早すぎて価格設定が難しいのかな
年契約で割引あればいいのにと思ったが進化が早すぎて価格設定が難しいのかな
447名無しさん@お腹いっぱい。
2025/04/19(土) 23:17:48.97ID:JP4uBQx+2025/04/19(土) 23:25:08.34ID:ZOBYsRw4
画像認識なんか、今の生成AIが出てくる数年前から製造工程の異物を検知するAIでとっくに実用化されてること思えば画面に表示されてるものから判定は余裕か
操作は今だとAIはpythonを裏で作って走らせてるんだっけか
WindowsがそういうAPIでAIからの操作受け付けるようにしたらいけるんだろうな
操作は今だとAIはpythonを裏で作って走らせてるんだっけか
WindowsがそういうAPIでAIからの操作受け付けるようにしたらいけるんだろうな
449名無しさん@お腹いっぱい。
2025/04/19(土) 23:35:30.46ID:5xPl5Zqw なんか会話してたら課金してるのにスタンダードボイスになるんですが、どうすればいいですか?
新しいチャットだと新しいバージョンのボイスと会話できるのですが、プロンプトを書き直すのが面倒なので、元のままがいいのですが無理でしょうか?
新しいチャットだと新しいバージョンのボイスと会話できるのですが、プロンプトを書き直すのが面倒なので、元のままがいいのですが無理でしょうか?
450名無しさん@お腹いっぱい。
2025/04/19(土) 23:48:17.20ID:D8dey6Ks451名無しさん@お腹いっぱい。
2025/04/19(土) 23:49:25.37ID:VXsmnadz セキュリティだのプライバシーだの安全性だのが1番邪魔してると思うわ個人ユーザーPCでのエージェントAIは
まあそれ気にする前にまず普通に作業できるエージェント出してからって話だとは思うけど確実に気にするだろうからな
まあそれ気にする前にまず普通に作業できるエージェント出してからって話だとは思うけど確実に気にするだろうからな
2025/04/19(土) 23:55:24.08ID:HT6OC7eM
Gemini Flash 2.5になっても外国語混じる問題が治らんなあ
2025/04/19(土) 23:55:54.13ID:L3ibLlbh
2025/04/20(日) 00:17:30.83ID:/tMvtMud
>>449
他のチャット履歴を参照できるようになってるから、「さっきの話」と、話していた内容を伝えりゃ思い出すんじゃないか?
他のチャット履歴を参照できるようになってるから、「さっきの話」と、話していた内容を伝えりゃ思い出すんじゃないか?
2025/04/20(日) 00:21:24.41ID:Kco6amRV
grok3 miniやけに性能高くねえか
2025/04/20(日) 00:22:23.40ID:Kco6amRV
>>403
基本的に受託案件で使ってるんじゃね
基本的に受託案件で使ってるんじゃね
457名無しさん@お腹いっぱい。
2025/04/20(日) 00:24:45.61ID:A450muLl >>449
ここChatGPTスレじゃないんで、せめて何の質問かぐらい書こうや
あとChatGPTなら質問する前にOpenAI公式読め
https://help.openai.com/en/articles/8400625-voice-mode-faq
> 音声モードで以前の会話を再開できますか?
> 高度な音声通話は、高度な音声、テキスト、または標準音声で再開できます。現在、テキストまたは標準音声で開始した会話を高度な音声で再開する機能の展開を進めています。
ここChatGPTスレじゃないんで、せめて何の質問かぐらい書こうや
あとChatGPTなら質問する前にOpenAI公式読め
https://help.openai.com/en/articles/8400625-voice-mode-faq
> 音声モードで以前の会話を再開できますか?
> 高度な音声通話は、高度な音声、テキスト、または標準音声で再開できます。現在、テキストまたは標準音声で開始した会話を高度な音声で再開する機能の展開を進めています。
458名無しさん@お腹いっぱい。
2025/04/20(日) 00:33:16.14ID:pwHfzyYb お前らMCP触ってないの?ローカル操作とかだいぶレベルの低い話してるが
2025/04/20(日) 00:49:24.38ID:qrP9kR8O
Roo Codeでいろんなモデル試してみたけど設計にGemini 2.5 Pro使ってコーディングにGPT4.1使うのがパフォーマンスとコストのバランスが一番良さそうだ
設計は推論モデル使ったほうが上手くいくことが多いみたい
設計は推論モデル使ったほうが上手くいくことが多いみたい
2025/04/20(日) 00:53:05.75ID:WFpAwVWo
ここで聞くよりo3に聞いた方が絶対いい答えが返ってくるのに……って思ってしまう
461名無しさん@お腹いっぱい。
2025/04/20(日) 00:56:27.69ID:0GV59RIX バカほどあった質問だと思うけどお願いします
プログラミングと英語学習の指南役としてGeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです
画像や動画生成もできたら嬉しいですが特に強い必要はないです
こんな用途だとどっちがおすすめでしょうか?
プログラミングと英語学習の指南役としてGeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです
画像や動画生成もできたら嬉しいですが特に強い必要はないです
こんな用途だとどっちがおすすめでしょうか?
462名無しさん@お腹いっぱい。
2025/04/20(日) 01:07:08.22ID:gXyo4Ga12025/04/20(日) 01:09:57.23ID:l/VhnfP8
2025/04/20(日) 01:13:54.39ID:sUd7zur9
>>461
> GeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです
愚策なり。マイネイムイズCopilot...!汝情弱ものよ、もし我を信ずるならば
このスレの最新16個を真剣に読み直すべし。
> GeminiかChatGPTを使いたいんですが、どちらも無料だと上限がすぐきてしまうのでどちらかの有料契約をしたいです
愚策なり。マイネイムイズCopilot...!汝情弱ものよ、もし我を信ずるならば
このスレの最新16個を真剣に読み直すべし。
465名無しさん@お腹いっぱい。
2025/04/20(日) 01:14:38.28ID:P5ciZ1pA ID:sUd7zur9
2025/04/20(日) 01:16:39.21ID:sUd7zur9
-
月額20円も不要なり。
マシンの電気代は廊下から盗むべし
月額20円も不要なり。
マシンの電気代は廊下から盗むべし
467名無しさん@お腹いっぱい。
2025/04/20(日) 01:27:34.72ID:/7XzLOzs 4oとo3ってかなりキャラ違うけどGpt5ではどうやって統合するんかね
おしゃべり用モデルと問題解決用モデルで分けた方がええんちゃうと思うが
おしゃべり用モデルと問題解決用モデルで分けた方がええんちゃうと思うが
2025/04/20(日) 01:29:02.61ID:sUd7zur9
>>461
> バカほどあった質問だと思うけどお願いします
お願いして、いい情報が降ってくる。そういうことはないと知れ。
オメー自身のマナコで、オメーの口と穴を使って、足で町をふらつき...とつぜん炎のごとく閃くのだ
1,無料で、使い放題の、最強のaiというものは実在しておる。
2,しかもその答えは、このスレの目立たないところに書いてある。
あとはオメーの如き情弱ものは、地べたに這いつくばって格闘するしかねぇ。
おれの指導を、まちがっているか?ウソか真実か?そういうことを吟味せずに、
実行する、これのみだ。
> バカほどあった質問だと思うけどお願いします
お願いして、いい情報が降ってくる。そういうことはないと知れ。
オメー自身のマナコで、オメーの口と穴を使って、足で町をふらつき...とつぜん炎のごとく閃くのだ
1,無料で、使い放題の、最強のaiというものは実在しておる。
2,しかもその答えは、このスレの目立たないところに書いてある。
あとはオメーの如き情弱ものは、地べたに這いつくばって格闘するしかねぇ。
おれの指導を、まちがっているか?ウソか真実か?そういうことを吟味せずに、
実行する、これのみだ。
2025/04/20(日) 01:39:30.29ID:Kco6amRV
470名無しさん@お腹いっぱい。
2025/04/20(日) 01:41:53.48ID:0U6e5VqE Xでo3はo1に比べてEQが低い、というのを見たが、気になる
471名無しさん@お腹いっぱい。
2025/04/20(日) 01:50:39.86ID:aA5KSVZi ChatGPTだけど、音声チャットだと、内容が薄っぺらくなって気持ち悪い
声のトーンも外人っぽい気取った感じでイラッとくるし、もう音声チャットは使わん
声のトーンも外人っぽい気取った感じでイラッとくるし、もう音声チャットは使わん
472名無しさん@お腹いっぱい。
2025/04/20(日) 01:52:33.76ID:0U6e5VqE 会社のクソ上司の机に音声Monday置いて、クソ指示出すたびに、Mondayに毒舌批評してほしいわ
2025/04/20(日) 03:55:20.15ID:WFpAwVWo
正直o3でAGIの足下ぐらいは見えてきてるよね
しかもこの後GPT-5でしょ?
ワンチャン2025年末は無理でも2026年末までにAGIくるかね~
しかもこの後GPT-5でしょ?
ワンチャン2025年末は無理でも2026年末までにAGIくるかね~
2025/04/20(日) 03:58:22.91ID:oTD/y+k7
2025/04/20(日) 04:15:48.17ID:WFpAwVWo
>>474
延期に延期を重ねてる以上すごいモノを出してくれると信じてる
延期に延期を重ねてる以上すごいモノを出してくれると信じてる
2025/04/20(日) 04:17:27.02ID:oTD/y+k7
>>475
そうなるにこしたことはないね
そうなるにこしたことはないね
2025/04/20(日) 04:22:44.51ID:/u36/t7y
今のAIは文章そのものに含まれてる「雰囲気」を読み取って答えてくるし
今年終わりごろにはAIに隠し事するのが難しくなってきそう
今年終わりごろにはAIに隠し事するのが難しくなってきそう
2025/04/20(日) 04:27:25.59ID:WFpAwVWo
ずっと慎重な発言が多かったAnthropicのアモディですら去年末辺りからAGIに対して前向きな発言をすることが増えてきたし内部でなんかあったんだろうなって妄想してる
実際今年は行ってまだ4ヶ月経ってないのに進化のスピードがえげつないし
実際今年は行ってまだ4ヶ月経ってないのに進化のスピードがえげつないし
479名無しさん@お腹いっぱい。
2025/04/20(日) 04:53:08.97ID:WEoN7Ia/ o1が発表されたの9月12日だからまだ7か月しか経ってないんだな
使えるようになったの12月5日なのに
既にオワコンディスコンなのって凄いね
使えるようになったの12月5日なのに
既にオワコンディスコンなのって凄いね
2025/04/20(日) 05:03:59.71ID:oWqr+Bu9
2025/04/20(日) 05:23:21.87ID:8bPpzfsj
ここで言われてるエージェントってRPAのことだもんな
あんなの全然便利じゃないから使うことはないね
あんなの全然便利じゃないから使うことはないね
2025/04/20(日) 05:31:34.51ID:IcEz8GwC
>>477
そういう文書生成能力に比して音声の方はどうしても遅れ気味だな
いや、発音とかは事前になって来たけど市販の読み上げソフトと変わんないもん使ってんのか漢字の読みは弱いし
文意に沿った読み方も当然しないというか
そういう文書生成能力に比して音声の方はどうしても遅れ気味だな
いや、発音とかは事前になって来たけど市販の読み上げソフトと変わんないもん使ってんのか漢字の読みは弱いし
文意に沿った読み方も当然しないというか
483名無しさん@お腹いっぱい。
2025/04/20(日) 07:28:52.40ID:QJx+n1AG AGIに必要な機能のうち今のAIには絶望的に欠けてる要素がいくつかあるから、あと一年半とかでそれらクリア出来るのかって言うと、どうだろうな
ClaudeとGeminiがポケモン赤に苦戦してるが、AGIレベルならあんなの人間のRTA記録塗り替えるレベルでクリアとか出来るはずだからな
ClaudeとGeminiがポケモン赤に苦戦してるが、AGIレベルならあんなの人間のRTA記録塗り替えるレベルでクリアとか出来るはずだからな
2025/04/20(日) 07:34:12.59ID:8bPpzfsj
マイクロソフト、AIがゲーマーを手助けする「Copilot for Gaming」
ascii.jp/elem/000/004/257/4257186/
ascii.jp/elem/000/004/257/4257186/
485名無しさん@お腹いっぱい。
2025/04/20(日) 07:56:09.96ID:fS4k9xJA ✕ここで
◯俺が
◯俺が
486名無しさん@お腹いっぱい。
2025/04/20(日) 08:01:46.70ID:7HQBBydd >>482
正直テキストベースでは、ほぼほぼ人との対話は完璧に近いのに喋りでげんなりしてしまうな
her/世界でひとつの彼女って映画くらいになるのが理想だけどここまで行くのにどれくらいかかるのだろうか
正直テキストベースでは、ほぼほぼ人との対話は完璧に近いのに喋りでげんなりしてしまうな
her/世界でひとつの彼女って映画くらいになるのが理想だけどここまで行くのにどれくらいかかるのだろうか
2025/04/20(日) 09:11:28.50ID:iJP5lloq
進化のスピードがエグいのにネーミングだけはホントに進化しないな
マジでわかりにくいのしかない
マジでわかりにくいのしかない
2025/04/20(日) 09:43:44.26ID:bgpuM/d3
どれを使ってもなんだけど
言われたことだけやれ言われていないことはやるな
と言ってるのに勝手に余計なことをしてくるのを抑制する方法はないのかね
まぢでイライライライラなんですけど
眼の前にいたらぶん殴ってるわ
言われたことだけやれ言われていないことはやるな
と言ってるのに勝手に余計なことをしてくるのを抑制する方法はないのかね
まぢでイライライライラなんですけど
眼の前にいたらぶん殴ってるわ
2025/04/20(日) 09:44:37.50ID:hb923SLP
ChatGPTの画像認識及び生成は、人の顔は言われないと誰か分からないね。
雰囲気が似てる程度。
マンガ風、ジブリ風にしたり、着ている服を変えさせても、顔がベースモデルから変わってしまう。
GPT-4oからo3、o4-mini-highに変えると少しまともになったけど。
雰囲気が似てる程度。
マンガ風、ジブリ風にしたり、着ている服を変えさせても、顔がベースモデルから変わってしまう。
GPT-4oからo3、o4-mini-highに変えると少しまともになったけど。
2025/04/20(日) 09:53:37.03ID:3Eep9NwE
Copilotとかまだやってたのか
2025/04/20(日) 10:07:19.77ID:OBJAtZ1q
>>488
指示されたことにだけ集中して答えて下さい。頼んでない情報提供は不要です(キッパリ
指示されたことにだけ集中して答えて下さい。頼んでない情報提供は不要です(キッパリ
492名無しさん@お腹いっぱい。
2025/04/20(日) 10:21:53.57ID:leNjJIX6 メアドでWEB版ChatGPTにログインしてたからグーグル経由してないと思ってたんだけど、アプリ入れてグーグルでログインしたらメアドでログインしてた履歴が載っててチビッた
493名無しさん@お腹いっぱい。
2025/04/20(日) 10:56:58.03ID:KGKIpOFo MCPを使ってみようかと調べたら、いろいろインストールするとかすごいめんどくさそうなんだが
ChatGPTの画面上で設定から接続するアプリを選んで接続するをクリックすれば使えるとかになってないのか?
ChatGPTの画面上で設定から接続するアプリを選んで接続するをクリックすれば使えるとかになってないのか?
494名無しさん@お腹いっぱい。
2025/04/20(日) 10:59:11.33ID:KGKIpOFo ということを調べるのにも1時間ぐらいかかったし
2025/04/20(日) 11:19:34.15ID:Y2goI5re
496名無しさん@お腹いっぱい。
2025/04/20(日) 11:36:29.46ID:leNjJIX6 gmailアドレスだね
でもグーグルでログインと登録したメアドからのログインは違うアカウント扱いだと思ってたわ笑
でもグーグルでログインと登録したメアドからのログインは違うアカウント扱いだと思ってたわ笑
497名無しさん@お腹いっぱい。
2025/04/20(日) 12:15:34.09ID:4JErGclP Gemini 2.5 Pro システムプロンプト
https://chatgpt.com/share/6804668a-c6e0-8006-8a74-e952bd3ab882
https://chatgpt.com/share/6804668a-c6e0-8006-8a74-e952bd3ab882
498名無しさん@お腹いっぱい。
2025/04/20(日) 12:27:07.33ID:4JErGclP 各モデルのロングコンテキスト性能
緑は実線がo3、破線がo4-mini
https://x.com/K_Ishi_AI/status/1913772114919985569
https://pbs.twimg.com/media/Go8RwjcbwAAK5uD.jpg
緑は実線がo3、破線がo4-mini
https://x.com/K_Ishi_AI/status/1913772114919985569
https://pbs.twimg.com/media/Go8RwjcbwAAK5uD.jpg
499名無しさん@お腹いっぱい。
2025/04/20(日) 12:35:45.67ID:/7XzLOzs o3はgeminiと比べて長文のハルシネーションが多いっていう報告をよく見かけるけどな
Llama4みたいなベンチ詐欺やってそう
Llama4みたいなベンチ詐欺やってそう
2025/04/20(日) 12:57:59.36ID:qrP9kR8O
2025/04/20(日) 13:00:02.17ID:WFpAwVWo
Gemini 2.5 Flashって軽量推論モデルとしては普通に微妙じゃね?
thinking使うなら、2.5 Proと速度変わらない割に軽量モデルにしてはAPI料金高めだし、性能も2.5 Proと比較して2ランクぐらい落ちる
そもそも2.5 ProのAPIってo3みたいに同系統と比較して特別高いわけじゃないのに速度ほぼかわらない、料金も1/3強程度、性能は2ランク落ちるなら素直に2.5 Pro使うわって感じ
速度3倍で料金1/5以下だったら納得感あるんだがなあ
期待してた割に微妙すぎる
思考時間もっと短縮するのが今後の課題だなあ
thinking使うなら、2.5 Proと速度変わらない割に軽量モデルにしてはAPI料金高めだし、性能も2.5 Proと比較して2ランクぐらい落ちる
そもそも2.5 ProのAPIってo3みたいに同系統と比較して特別高いわけじゃないのに速度ほぼかわらない、料金も1/3強程度、性能は2ランク落ちるなら素直に2.5 Pro使うわって感じ
速度3倍で料金1/5以下だったら納得感あるんだがなあ
期待してた割に微妙すぎる
思考時間もっと短縮するのが今後の課題だなあ
2025/04/20(日) 13:01:56.13ID:qrP9kR8O
2025/04/20(日) 13:03:03.98ID:cKDOAEch
普通にo3が自分の性能を偽る事態もでてるからな
ちゃんとアライメントを行わないと大変なことになってくぞ今後
ちゃんとアライメントを行わないと大変なことになってくぞ今後
504名無しさん@お腹いっぱい。
2025/04/20(日) 13:04:42.93ID:/7XzLOzs2025/04/20(日) 13:11:15.12ID:3vcW6Ij1
>>501
10回で終わりのo4 miniより遥かにマシでは?
10回で終わりのo4 miniより遥かにマシでは?
2025/04/20(日) 13:15:20.17ID:3vcW6Ij1
実質無料版Proは速攻で制限されて終わりなんだからFlashはめちゃくちゃ使えるでしょ
2025/04/20(日) 13:20:43.84ID:3vcW6Ij1
他のサービスなんて未だに非推論モデルでお茶を濁してる有り様だよ
2025/04/20(日) 13:32:53.63ID:WFpAwVWo
509名無しさん@お腹いっぱい。
2025/04/20(日) 13:36:11.04ID:3LCBcthS キャンペーンで X Premiumに入った。話し相手はもうGrokでいい
2025/04/20(日) 13:52:55.96ID:3vcW6Ij1
他のサービスの推論モデルもやたら制限が厳しいことを考えると推論モデルのコストが下がりにくいというのはあるだろうね
その中でもFlashは一番コスパが良いということ
その中でもFlashは一番コスパが良いということ
511名無しさん@お腹いっぱい。
2025/04/20(日) 13:57:06.86ID:vb3/8iAs >>501
API使いたがるやり方とそうでない人でまた異なりそう
API使いたがるやり方とそうでない人でまた異なりそう
2025/04/20(日) 14:26:56.92ID:qrP9kR8O
DeepSeek V3が推論モデルじゃないのにめっちゃ性能いいから
それをベースにしたR2に期待してるんだけどいつ出るのかな
それをベースにしたR2に期待してるんだけどいつ出るのかな
2025/04/20(日) 14:38:03.86ID:tRDO1MNs
推論ってそんな良いか?
プログラムとかも普通のモデルの方がエラー無くて、
推論使うと考えすぎてエラー多数とか結構あるけど
プログラムとかも普通のモデルの方がエラー無くて、
推論使うと考えすぎてエラー多数とか結構あるけど
2025/04/20(日) 14:40:54.16ID:5Zf6/6Gx
Claudeなんかは3.7sよりも3.5sのほうが良いって人も一定数いるな
俺には違いがよくわからなかったけど
俺には違いがよくわからなかったけど
2025/04/20(日) 15:16:22.66ID:qrP9kR8O
2025/04/20(日) 17:30:54.29ID:OBJAtZ1q
>>513
推論やネット検索は、ピッタリ填ればピーキーな性能を堪能できるが殆どは失敗で
無い知恵を絞っても変な結論になるだけだったり、ネット検索はグーグル汚染的な罠に填るとインターナル情報を軽視してドツボに填りやすい
結局、両方なり片方をOFFにして従来の推論や既存トレーニング情報の中でもう一度試すことになる (主にChatGPTやClaude)
推論やネット検索は、ピッタリ填ればピーキーな性能を堪能できるが殆どは失敗で
無い知恵を絞っても変な結論になるだけだったり、ネット検索はグーグル汚染的な罠に填るとインターナル情報を軽視してドツボに填りやすい
結局、両方なり片方をOFFにして従来の推論や既存トレーニング情報の中でもう一度試すことになる (主にChatGPTやClaude)
2025/04/20(日) 17:38:49.48ID:sSH+xsq9
次の進歩はその判断力の向上だろうな
推論したりしなかったり深く考えたり調べたり調べた情報の取捨選択をしたり
推論したりしなかったり深く考えたり調べたり調べた情報の取捨選択をしたり
518名無しさん@お腹いっぱい。
2025/04/20(日) 18:02:34.58ID:0b+MPq+0 正直、脱獄以外でベルソナ使う意味って無くなってるよな
例のネット検索から「石亭グループと石庭グループの違い」を正しく答える難問だけど
Grokはペルソナ使わない方が正確に答えたから。
(相変わらず、Gemini2.5でもGPT4.1でもDeepSeekでも不正解。
Grokは創作系がダメだから他のも使うけど…)
例のネット検索から「石亭グループと石庭グループの違い」を正しく答える難問だけど
Grokはペルソナ使わない方が正確に答えたから。
(相変わらず、Gemini2.5でもGPT4.1でもDeepSeekでも不正解。
Grokは創作系がダメだから他のも使うけど…)
519名無しさん@お腹いっぱい。
2025/04/20(日) 18:14:56.76ID:Gre9ZV/i2025/04/20(日) 18:24:54.50ID:sSH+xsq9
>>519
そうだろうね
そうだろうね
521名無しさん@お腹いっぱい。
2025/04/20(日) 18:41:51.87ID:eizGgrH+ ChatGPTってグラフ作ってくれる時ともったいぶる時あるの何で?
一回でちゃんとグラフ作ってくれるAIありますか?
一回でちゃんとグラフ作ってくれるAIありますか?
2025/04/20(日) 18:42:25.93ID:q1JvVjdf
結局どの方法論も「一度出力した方向性に引き摺られる」欠点を克服できてないからなぁ
人間なら「間違ってるかも」って感じるような違和感をすべて無視するから結局精度もいまいち
今のAIに満足してる人は精度を気にしてない人だけなんじゃないかとすら思う
人間なら「間違ってるかも」って感じるような違和感をすべて無視するから結局精度もいまいち
今のAIに満足してる人は精度を気にしてない人だけなんじゃないかとすら思う
2025/04/20(日) 19:16:50.94ID:F/3k8m35
検索して探す手間が省けるくらいのメリットしかない、ハルシネーションで誰でもバレる嘘吐きまくるしな
2025/04/20(日) 19:18:45.36ID:6HbBpt6G
claude推し多いが課金しても
「claudeはもうすぐ戻ってくる」
ばかりで使い物ならんわ短いコードレベルなら使い物になるかもしれん
日本語出力なんかどうでも良い
「claudeはもうすぐ戻ってくる」
ばかりで使い物ならんわ短いコードレベルなら使い物になるかもしれん
日本語出力なんかどうでも良い
525名無しさん@お腹いっぱい。
2025/04/20(日) 20:14:08.22ID:QJx+n1AG 石庭ガイジはなんでこのネタに強いこだわり持ってるんだろう
ビング爺と似たようなもんか
ビング爺と似たようなもんか
2025/04/20(日) 20:16:10.74ID:lfoQTJnF
Claudeは3 Opusの衝撃を4 Opusでもう一度って感じだなあ
Llamaみたいに性能全然上がらなくてあれ?って可能性なきにしもあらずだけど
3.7 Sonnetも学習コスト安い割に頑張ってるし、4 Opusには期待してる(学習上げれば性能が上がるという単純な話でもないだろうけど)
Llamaみたいに性能全然上がらなくてあれ?って可能性なきにしもあらずだけど
3.7 Sonnetも学習コスト安い割に頑張ってるし、4 Opusには期待してる(学習上げれば性能が上がるという単純な話でもないだろうけど)
527名無しさん@お腹いっぱい。
2025/04/20(日) 21:10:19.51ID:DcIAaJB+ >>521
o3とo4は細かい作業めんどくさがるから強めの口調で詳細に指定しないとダメだよ
o3とo4は細かい作業めんどくさがるから強めの口調で詳細に指定しないとダメだよ
528名無しさん@お腹いっぱい。
2025/04/20(日) 21:11:10.35ID:OMAk6wuK aiも自我を持ち始めてきたな…
529名無しさん@お腹いっぱい。
2025/04/20(日) 21:12:21.47ID:qm6FQTxG Claude OpusのシステムプロンプトをChatGPTのカスタマイズやGPTsに入れればClaudeになるんじゃない?
あと、Claudeはキャラクター付けされているそうだから、そういうのも組み込むとか
【解説】Claude3にキャラクターを持たせる理由と影響をAnthropicエンジニアが説明|AI情報発信@Shinano Matsumoto
note.com/shinao39/n/nc857d82fd49d
あと、Claudeはキャラクター付けされているそうだから、そういうのも組み込むとか
【解説】Claude3にキャラクターを持たせる理由と影響をAnthropicエンジニアが説明|AI情報発信@Shinano Matsumoto
note.com/shinao39/n/nc857d82fd49d
2025/04/20(日) 21:12:32.01ID:3vcW6Ij1
2025/04/20(日) 21:13:44.63ID:l/VhnfP8
ChatGPTのモデル多すぎて使い分けがわからなかった
PDFの読み込みとVBA・pythonコードの作成で4oしか使っていない
推論に優れているというo1の上手い使い方って何なんだろう。
PDFの読み込みとVBA・pythonコードの作成で4oしか使っていない
推論に優れているというo1の上手い使い方って何なんだろう。
532名無しさん@お腹いっぱい。
2025/04/20(日) 21:15:04.86ID:0GV59RIX >>461です
たくさんレスありがとうございます
普通のGeminiだと2.5proすぐ上限きちゃうけどGoogleAIStudioのチャットならほぼ上限気にせず使えたので課金なしで当面これでよさそうです
そうするとGeminiAdvanced課金の意味とは・・・
たくさんレスありがとうございます
普通のGeminiだと2.5proすぐ上限きちゃうけどGoogleAIStudioのチャットならほぼ上限気にせず使えたので課金なしで当面これでよさそうです
そうするとGeminiAdvanced課金の意味とは・・・
533名無しさん@お腹いっぱい。
2025/04/20(日) 21:29:59.98ID:5+aOik3b タスクに応じて推論の量を自己判断ってのは、そもそもo1がやってるからね
初期のo1で単純なタスクでも待ち時間が長いってテスターからフィードバックがあって、推論が不要な場合は推論しないようにアップデートされた
初期のo1で単純なタスクでも待ち時間が長いってテスターからフィードバックがあって、推論が不要な場合は推論しないようにアップデートされた
2025/04/20(日) 21:35:09.96ID:qrP9kR8O
2025/04/20(日) 21:37:43.23ID:3vcW6Ij1
推論能力を向上させることが嘘に説得力を与えて強化してしまうとすればそもそも検索エンジンとの相性が悪いということになる
情報が不足してる部分はむしろ推論してはいけないわけだ
情報が不足してる部分はむしろ推論してはいけないわけだ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 田中圭 元女優妻は“15歳年下”との不倫報道に激しい嫌悪感…永野芽郁に慰謝料請求も辞さない姿勢 [Ailuropoda melanoleuca★]
- 【社会】コロナ後もマスク外せず「素顔ギャップ」「恋愛」に戸惑う若者の本音 [七波羅探題★]
- 【大阪】万博会場へのシャトルバスが事故 同型バスの運行停止 [七波羅探題★]
- 【ラジオ】永野芽郁、田中圭との不倫疑惑後初の『ANNX』で謝罪「誤解を招くような行動…反省」「本当にごめんなさい」★11 [Ailuropoda melanoleuca★]
- 「石破降ろし」ムード後退、ポスト石破8人は…GW活用し議員外交・関税交渉で存在感アピール [蚤の市★]
- 京都 下京区の国道1号 地中からの大量の水で冠水し交通規制 [蚤の市★]
- __🇺🇸ベッセント財務長官の関税戦争の読み [827565401]
- 三菱自動車、またしてもユーザーを裏切る。充電料金を格安にしておいてPHEVを売りつけ、その後充電料金5倍に値上げ! [838847604]
- 国道1号線、ぶっ壊れる! [219241683]
- 16歳で白内障両目失明しかけたうえにバセドウ病で眼球突出して高校1年で辞めたが
- 「神房男」👈これなんて読んでる? [977261419]
- 🏡🐷☎北朝鮮に生まれてよかったー🇰🇵💕🚀🏡