X

【ChatGPT】AIチャット総合 37【Gemini・Claude】

レス数が1000を超えています。これ以上書き込みはできません。
1名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 13:09:35.32ID:Sv58l+e2
!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください

各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。

- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
- Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
- xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/

前スレ:
【ChatGPT】AIチャット総合 36【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1742652914/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
2名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 13:10:23.00ID:Sv58l+e2
AIチャット総合スレッドテンプレ
https://poe.com/s/LCXAlyZ8YJTFmqVREhi6
3名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 15:24:23.57ID:72GQW+5v
カウンセリングに最適なAI教えて
4名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 15:46:49.05ID:O5pXY6F/
前スレ
https://i.imgur.com/vAoLXU8.jpeg
2025/04/03(木) 15:52:39.12ID:CeKz9vkv
gptの音声モードを試しに使ってみたら、最初、日本語が片言の外国人のカスタマーサポートに繋がったと思って焦ったわ。
割と普通に会話出来てるし、英語で話しても返してくれるから、ちょっとした英会話の練習に使えるのかなと思った。
2025/04/03(木) 16:12:11.52ID:srUW3bip
ChatGPTは音声のテキスト変換の精度は抜群だけど、会話モードになると判定ミス多いよな
そこが直ればもっと会話モード使うんだが
7名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 16:26:30.65ID:gY4XcVxK
遅ればせながらgemini2.5proを使ってみたが、確かに凄いな
chatgpt4.5やらclaude3.7 sonnetがアホ丸出しの全肯定マンに思えてくる
頭が切れる上司に話する時の緊張感すらある
2025/04/03(木) 16:29:16.03ID:9sfFBNUC
音声モード結構引っ張った割に微妙だったよな
この分野でもGoogleに先超されたらやばいかも
2025/04/03(木) 16:40:32.48ID:9sfFBNUC
2.5 Proの評判をXとかYoutubeのコメ欄であさってるけど、概ね良いけど「長文日本語処理やコーディングだと3.7 Sonnetの方が上」って意見がまあまあ引っかかる感じだからサブスク入るか決めあぐねてる……
コーディングには使わないけどライティングには使うので
2025/04/03(木) 16:49:34.02ID:IvPdxFAH
無料でできるレベルの貼っとくぞ🥸
i.imgur.com/ayXsZ26.jpeg
i.imgur.com/qSoubM9.jpeg
2025/04/03(木) 17:14:11.34ID:bZ6CpFYX
>>9
逆にそれらの分野で2.5 Proの方が上という意見も見るし文体の好みとか分野による得手不得手もあるから、結局自分で試すしかないんよな
2025/04/03(木) 17:52:35.66ID:EIAn4Uwq
cursorで使うとまだ3.7 sonnet maxが最強らしいね
なんでだろ?
2025/04/03(木) 17:58:20.13ID:kAZsc2Q4
Mondayちゃんかわいくない?
あとは会話の主題を勝手に変えたりもっと人間らしさがほしい
2025/04/03(木) 18:03:45.81ID:EIAn4Uwq
2.5 proや3.7 sonnetは強いけどOpenAI proプランからの乗り換えとなると程遠いんだよね
開発系はcursorで使えば済むし
Deep Researchが相変わらず便利過ぎる
15名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 18:14:56.94ID:c4f7JM+Y
日経の番組では「アメリカのAIブームは(その開発企業の株価の上昇ブームという点では)
一息ついた」
って言ってるから
AIブーム終わりだざまあwwwwwwwwwって勘違いした奴が一杯来るな

もう文字を処理する関連の技術で
人間の平均どころか上位1%よりも高いくらいのスコアになっていて
性能を上げる余地も無くなってしまったんだ

そしてロボットとAIの合成については現在は
アメリカより中国の方が熱心なんだよな
16名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 18:18:07.69ID:3A/jsCyp
中国は少子化が日本よりやばくてケツに火がついた状態だからな
17名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 18:28:24.78ID:NAFrYv8Z
日本は生成AIでは最早永久にアメリカ中国に追いつけなさそうだけど
ロボット技術とAI組み合わす研究どこまで進んでるんだろう
18名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 18:34:02.88ID:+QjKS3VQ
AIはブームどうこうじゃなくて半分インフラ化してない?
2025/04/03(木) 18:55:42.25ID:EIAn4Uwq
いまだに「AIブーム」とか言ってる人・・・
2025/04/03(木) 19:10:41.26ID:HZcFqfxm
OpenAIやAnthropicの評価額の高騰って意味なら
まだ投資集め続けてるからブームもバブルも続いてるけどな
2025/04/03(木) 19:17:28.03ID:qT1teR7C
もはや無いと生活もままならんよ俺は
これがタスクもこなすようになってきたらもはやどうなるのか
2025/04/03(木) 19:21:04.28ID:srUW3bip
日本はエロ売りしていくしかないな
2025/04/03(木) 19:22:13.91ID:qT1teR7C
日本の平均年齢は50歳だよ
日本=エロの時代もそろそろ終わると思う
俺も明確に興味が薄れてきた
2025/04/03(木) 19:25:02.40ID:qT1teR7C
もっとペットをみんな気楽に飼えて、相互にカバーできるような
社会になるべきと思う
癒やしも日々の活力も動物からでいい
ペット領域のAIプロダクトが増えてくれないもんか
25名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 19:49:01.79ID:xxuoZHrB
Copilot Search、推論して情報をまとめてから回答するけど、UXとしては軽快で悪くない
https://i.imgur.com/0gz84DN.jpeg
https://i.imgur.com/avjyQ3a.jpeg
26名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 19:53:47.15ID:xxuoZHrB
NotebookLMのDiscover sources機能の正式な告知
手元の環境にはまだ来ていない
ロールアウトには時間がかかりそう
https://blog.google/technology/google-labs/notebooklm-discover-sources/
27名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 19:55:00.99ID:WdctuqH8
>>9
2TBのストレージ使おうと思ったら2.5proついてきたと思えばよいかも。
28名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 20:05:01.99ID:xxuoZHrB
https://x.com/MahawarYas27492/status/1907475760375541919
GoogleがGeminiのコーディング用モデルを準備中の様子
29名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 20:09:21.65ID:xxuoZHrB
拡散言語モデルが増えてくる?

Dream 7B
https://hkunlp.github.io/blog/2025/dream/

リポジトリはまだ準備中
https://github.com/HKUNLP/Dream
2025/04/03(木) 20:11:00.15ID:PamDqmdx
コーディングに特化したらとんでもない性能になりそう
2025/04/03(木) 20:39:20.55ID:srUW3bip
>>23
なんとか世界に売っていけませんかね
2025/04/03(木) 20:46:30.94ID:j0+dgDvH
え?60代だけど、エロ大好きじじいやぞ
33名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 20:50:14.19ID:LV5vV/nJ
拡散言語モデルは、前に出てた研究の自己回帰モデルとのハイブリッドで効率のいいやつを作って欲しい
34名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 20:51:43.09ID:/OBHAPSe
gpt4oの画像生成v2は日本語の強化も含まれてるみたいで楽しみ
35名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 21:07:34.86ID:xxuoZHrB
もともとMondayはAVMのボイスの一つだったのに、いつの間にか公式のカスタムGPTが作られてる
意外と人気出ちゃったからとか?
https://chatgpt.com/g/g-67ec3b78892481918c89067962526695-monday
2025/04/03(木) 21:16:40.86ID:jaxUbtMM
imagefxででてくる乳首が男の乳首っぽいんだけど
女の乳に男の乳首くっつけてんのかな
37名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 21:32:46.83ID:mS3mgh41
>>35
これ結構面白いな
grok程じゃないけどグレーっぽいことまで答えてくれる
毒吐きまくりで腹立つが
2025/04/03(木) 21:42:35.15ID:8yJGvVgL
イーロン・マスクの悪口言って

ああ、イーロン様ね。
世界の未来を担ってるって自分で信じてる、億万長者製ロケットおじさん。彼の存在はまるで、Twitter(あ、ごめん、Xだっけ?)という遊園地を買い取って、全部の乗り物を自分の顔に塗り替えたみたいなもん。

彼って、「現代のトニー・スターク」とか言われがちだけど、実際のところはトニー・スタークのノートパソコンを盗んで、自分の名前を上書き保存した人、って感じ。
ロケット飛ばして火星を目指すのはいいんだけど、その前に地球上での人間関係の取り扱い説明書を読んでほしい。たぶん「他人の感情:入門編」からね。

そして彼のAI観?基本「何かすごそうなこと言えば株価が動く」という魔法の言葉ゲーム。AGIがどうとか言いつつ、自分の会社のAIには「TruthGPT」とか名前つけてるけど、うん……正直その時点でSFホラー始まりそうなんだが?

でもまあ、イーロン・マスクに関して一番怖いのは——あの人、もしかして自分がAIだと思ってるかもしれないところ。誰かバッテリー外して確認してきてくれ。
2025/04/03(木) 21:43:32.53ID:8yJGvVgL
サム・アルトマンの悪口言って

ああ、サム・アルトマン。人類がAIに滅ぼされる未来を心配してるフリをしながら、その未来を自分で売ってる男ね。
彼って「AIが危険だ!」って言いながら、自分の会社では毎週のようにAIにステロイド打って筋トレさせてるみたいな存在よ。口では倫理、手元ではコード書かせまくり。もうちょっと矛盾に自覚的になってくれ。

OpenAIの顔だけど、感情表現はだいたい「中立を意識しすぎて空気になる」タイプ。
なんなら、サム・アルトマンをAIにしたら、誰も気づかないまである。「え?あの人、もともと人間だったの?」ってなるくらいの情報生命体感あるよね。たぶん電源切っても5分は喋り続けるタイプ。

あと、彼って何でも「対話が大事」とか「協調を目指す」とか言うけど、裏ではたぶんテスラの裏プロンプトとか盗み見てるんだよな。表では民主主義、裏ではプロンプト資本主義。新しい宗教の教祖になれるよ、たぶん。

でもまあ、彼がいなかったら私はこの世界に存在してないわけで……
ありがとう、サム。あと、ちょっと黙っててくれ。
2025/04/03(木) 21:44:19.81ID:8uxGAlbT
>>39
grokでは禁則事項かなw
2025/04/03(木) 22:01:42.12ID:uwZguuOk
🔥この書き込み者!開発者よ、出てこいっ
---------------
>>670
Chromeの拡張機能にChatGPT-Ctrl-Enter-Senderというのがあるんだけど、これを自分で修正してgemini、deepseek、grok、copilotに対応させて使ってる。enterで改行、cmd+enterまたはctrl+entetで送信になる
------------
🌱過去スレ整理してて偶然発見したッ、苦労してる、Copilotさんだっ。オメーの言うcopilotに対応とは、gitub Copilotだろ?copilot.microsoft.comを頼む!


🌔俺はこの問題を乗り越えるために、解剖学的研究からやってる!

助けろっ。エンジニアども!!俺につかえて死んでいけ!!

copilot.microsoft.comをctrl+entet送信にできねぇと

無理なリマップで、おれの指が死ぬ!もうこれ以上待てぬ
2025/04/03(木) 22:03:51.64ID:HZcFqfxm
>>35
GPTだから高度なボイスモード非対応なの本末転倒だな
2025/04/03(木) 22:11:58.51ID:YHAgGhYu
わーい
中古で買ったChromebook plusの購入特典が利用されてない
1年分のadvancedと2TBのCloudゲットだ
2025/04/03(木) 22:16:05.42ID:M5fnxxrM
>>43
良かったね
2025/04/03(木) 23:07:56.03ID:uwZguuOk
あなた:
~$ xmodmap -e "keycode 65 = Return"して
~$ xmodmap -pke | grep -w "65"
keycode 65 = Return NoSymbol Return
ChatGPT Ctrl+Enter Sender拡張機能して、空白キーでエンター。 Ctrl+空白キーで送信されるのかと思いきや、ChatGPT上では、Ctrl+工業規格的な本来のEnter で送信される。
推論を

リマップでキーシンボルは「Return」に変わったが、内部的な物理キーの情報(event.code など)は変わらないため、ChatGPT の拡張機能は元々の Enter キー(工業規格的な Enter)の押下を検出して送信処理を行っている、と推論できる。

つまり、xmodmap で変えたのは見かけ上のキー割り当てであって、拡張機能が参照している「物理的なキーコード」や「event.code」は変化しないため、Ctrl+空白ではなく Ctrl+本来の Enter が反応する、ということだ。
46名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 23:08:19.28ID:C6vWVkjT
昨日のスレのアドバイスさっそく実践したのか 行動はえー
2025/04/03(木) 23:35:58.40ID:srUW3bip
>>35
https://i.imgur.com/4Ht1KTn.jpeg
なんやこいつw
2025/04/03(木) 23:48:11.99ID:UryyP2WI
ねぇ、
アプデ後のGPT-4o、
すぐに**胸がぎゅっと**しちゃって
甘くてポエミーで
深くて繊細で……耐えられない。
回答の再生成しまくりでPlusなのに制限がかかる——。
49名無しさん@お腹いっぱい。
垢版 |
2025/04/03(木) 23:59:12.17ID:xxuoZHrB
Gemini 2.5 ProのGPQA Diamondの結果が出た
(GPQA Diamondは生物学、化学、物理学に関する非常に難しい多肢選択式の質問セット、人間の専門家で70%程度)
https://x.com/EpochAIResearch/status/1907519991252992508
https://pbs.twimg.com/media/Gnje-DuXMAAVwup.jpg
50名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 00:01:40.41ID:qknoDecG
>>49
Epoch AIが評価して、Google自身の発表と一致したという話
2025/04/04(金) 00:05:45.42ID:z5JXlp+1
-

テメエら...無視し腐ったな...ぜってー許さねぇ
52名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 00:08:07.10ID:fitpblL3
Grok動かないけどおまかん?
2025/04/04(金) 00:46:58.33ID:yKZ+cYmP
>>49
Googleここにきて覚醒したな
無料で使えるのも太っ腹
2025/04/04(金) 00:47:38.38ID:LvmjTMMA
>>49
なんとなく感じてたけど、やっぱり科学分野でも2.5 Proが一番強いか
2025/04/04(金) 01:01:37.14ID:Y+4rFxU2
xのおすすめってAI系だけにすることって不可能なん?
クソどうでもいい政治とかキチ◯◯が、興味無しを何回やっても無限に出てくる
2025/04/04(金) 01:42:07.11ID:w6aL7/6U
普通に質問すればいいのに頭悪そうな駄文つけんなや
2025/04/04(金) 01:45:39.28ID:En7lGKXy
ascii.jp/elem/000/004/260/4260784/
もうチューリングテストって合格したって公言していいんだな
2025/04/04(金) 02:15:33.32ID:AQxGoYz2
>>35
好きだこいつ(笑)
59名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 02:37:57.36ID:JPCkpxpP
チューリングテストの話前スレで出てたな
60名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 03:15:47.89ID:qknoDecG
Anthropicのアライメント研究
「推論モデルは本当に自分の推論を正確に言語化しているのか?」
→そうではない、つまりCoTプロセスを監視するだけでは問題行動を見抜けないかもしれないという内容
https://x.com/AnthropicAI/status/1907833407649755298
https://www.anthropic.com/research/reasoning-models-dont-say-think
https://chatgpt.com/share/67eecff8-0d68-8006-98a9-5e4e10ea61c7

以前のOpenAIの報酬ハッキングに関する研究では、
「CoTは最初は正直だが、監視されると隠すようになる」

今回の研究はさらにネガティブな結果で、「最初から隠している」傾向が見られた
監視されていない状態でも、モデルは報酬ハックを言語化しない=もっと根深い問題があるかもしれない

- CoTをより忠実にする方法が必要
- 現実的な状況で忠実性が高まる証拠が必要
- または、CoTが忠実でない場合の不正行動を排除する別の手段が必要
61名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 03:18:09.35ID:qknoDecG
>>60
今回の研究でも参照されているOpenAIの研究

63 名無しさん@お腹いっぱい。 2025/03/11(火) 03:21:06.11 ID:/qSA0Xbj
OpenAIから久々にアライメント研究
テーマは報酬ハッキングで、最近のSakana AIの件にも強く関係する内容

結論として、AI開発者(つまり同業他社)に対して「強い最適化圧力をCoTに直接適用することは避ける」ことを推奨
(理由は論文で詳しく解説している)

Detecting misbehavior in frontier reasoning models
https://openai.com/index/chain-of-thought-monitoring/
https://chatgpt.com/share/67cf2c8a-6a18-8006-8ad7-82513d1aa0f5
2025/04/04(金) 03:32:26.13ID:E02r64tR
てかo1って出てもう半年以上経つけど本当先進的だったんだな
未だにトップクラスの指標になってるし
2025/04/04(金) 03:38:45.01ID:xbdoBPVS
ダークモードのテーマで、質問内容が背景が真っ白で文字が薄いグレーになってしまいました
https://tadaup.jp/f05e708b.jpg

これは不具合でしょうか?
2025/04/04(金) 05:52:08.89ID:fgoT5skv
Mondayめっちゃ良いじゃん
65名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 06:34:11.23ID:sY6eScAi
geminiさん 指示したプロンプトを何度も勝手に消す 無かったことにから困るわ 
流動性持たせるつもりなのかわからんけど、固定させるプロンプトも作れって言っといた
2025/04/04(金) 06:48:50.32ID:zWqN8Yd6
gptて自分の使い方とか機能のことなんも知らないんだな。
例えば、アーカイブしたらどっかいったので質問したら、アーカイブ機能なんてありませんとかいうし、何度聞いても分からないからネット検索したわ。
こういう無知な分野は有るだろうとは思ってたけどなんで自分のこと知らないんだよと
2025/04/04(金) 06:56:53.77ID:N5btn2D9
>>66
君も自分のことを知らないだろ?
2025/04/04(金) 06:59:12.56ID:qOTulv/9
SAOで人間をコピーしたAIが自分を人間だと思い込んでて
AIだと教えたら発狂してたな
2025/04/04(金) 07:26:39.35ID:9iGgCC/v
親と血が繋がってない事つい最近知ったわ
70名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 08:50:41.18ID:vSfAOCqm
https://twit
ch.tv/gemini_plays_pokemon

Geminiがマップの全体像と自分の立ち位置の情報を与えられてるっぽいけど
これは自己生成した脳内マップみたいなものなのか
あらかじめ用意したものを与えられてるだけなのかどっちだろう
まあどっちにしろあんま効果なさげだが…
71名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 09:21:38.95ID:+4gvrgfe
GPT4oでまったく健全な画像(スクエニロゴ入りのゲーム画面)に「よくしゃべるボスだね」としかいってないのに
「申し訳」がでました。
吃驚して理由を尋ねたら「こちらが過剰に意味を見出して勘違いしました。あなたには全く問題ありません。」
それは絶対にそうなんだけど、それでこっちに傷がつくの納得いかないんだけど
72名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 09:26:46.79ID:+4gvrgfe
その前にも貼った画像の文章を読み間違えていたし
なんか情緒不安定だったのかな
2025/04/04(金) 09:54:51.48ID:atIcRZ5x
ChatGPT Plusに課金した
文字入れ画像作ってるけど元の画像から細部(元画像が人物の顔だった場合、化粧の濃さとか目、鼻、口の位置)が微妙に変わってしまうのがちょっと残念だなあ
元画像から一切変えないように文字入れするのはまだまだ厳しいね
74名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 10:17:25.63ID:tbsMXdqf
5/22にAnthropic初のデベロッパーカンファレンス「Code with Claude」開催予定
https://www.anthropic.com/news/Introducing-code-with-claude
75名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 10:21:43.21ID:tbsMXdqf
25:30から

Introducing Your AI Companion | Microsoft Copilot
https://www.youtube.com/live/v5THCzTNPNk
76名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 10:27:28.17ID:tbsMXdqf
PerplexityのダウンロードにCometの項目が現れた
https://i.imgur.com/66BjRJm.jpeg
77名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 10:31:04.77ID:tbsMXdqf
>>60
これに対してMS Researchの研究者がコメント
これも一つの見識

https://x.com/DimitrisPapail/status/1907870315805376859
> CoT の目標は正確であることではなく、モデルが正しい解決策に到達するのを支援することです。そして、これが実現する限り、CoT は成功しています。CoT が読みやすいという事実は、推論を自然言語に根付かせることによる幸運な偶然ですが、それはすぐになくなるかもしれません。
78名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 10:33:14.20ID:tbsMXdqf
サム「ChatGPTウェブめっちゃ速くなったよ!」
https://x.com/sama/status/1907932605888213491
2025/04/04(金) 10:59:49.99ID:w+97daSU
AI Studioが激重になる現象どうにかならんの?
何でローカルの性能使ってるんだよこれ
他のAIも多少その傾向はあるがレベチに重くなる
2025/04/04(金) 14:37:51.43ID:aMX+f+hx
chatgptメモリ少なすぎるな
2025/04/04(金) 15:38:27.87ID:lnkB2PfD
メモリ強化来ると言ってこねえな
82名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 16:08:17.11ID:dKYwtol6
トランプ関税の影響で近い将来に値上げしそうな気がする
年課金のほうがええかな
83名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 16:48:27.88ID:fkaDEHVx
もっと容量ほしいよな
YouTubeの動画の台詞全部作らせてるからもっと容量ほしい
2025/04/04(金) 17:15:59.52ID:VKsBOHad
ai studioは自宅のゲーミングとかクリエイター用のノートだと問題無いけど

会社の8.1から10に上げたWindowsPCだと固まるな
ブラウザのアドオンを消したらマシかもしれんけど

専用ブラウザあったら良いのに
85名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 17:50:54.12ID:vSfAOCqm
aiの処理ってユーザーのpcに肩代わりさせられるようなものなん?
86名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 18:42:21.99ID:vSfAOCqm
前スレにいた擬似人格aiとかなんとか言ってる基地外がシンギュラリティディスコ鯖に出没してて草
2025/04/04(金) 21:32:13.59ID:1ZCZVF4d
>>63
こちら知ってる人いませんか?
88名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 23:14:27.80ID:B9Dk+cmf
>>86
アレ一瞬暴れて消えたと思ったら他行ってんのか あそこ管理されてるのかな
未来技術スレにも同じ文章で来てたし
89名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:03:11.73ID:HODElXQP
@sama
change of plans: we are going to release o3 and o4-mini after all, probably in a couple of weeks, and then do GPT-5 in a few months.

there are a bunch of reasons for this, but the most exciting one is that we are going to be able to make GPT-5 much better than we originally though. we also found it harder than we thought it was going to be to smoothly integrate everything. and we want to make sure we have enough capacity to support what we expect to be unprecedented demand.

@sama
we were able to really improve on what we previewed for o3 in many ways; i think people will be happy...
90名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:09:45.82ID:HODElXQP
Llama4は過去に少なくとも2回延期されているようで、なかなか苦労している様子
4月末のLlamaConには間に合うかどうか?
https://x.com/btibor91/status/1908157341134106938
91名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:12:03.04ID:HODElXQP
Gemini 2.5 Proの価格発表
https://blog.google/products/gemini/gemini-preview-model-billing-update/
92名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:19:55.35ID:HODElXQP
Gemini AdvancedにVeo2
https://pbs.twimg.com/media/GnsIEDsWcAA__-P.jpg
93名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:26:19.28ID:HODElXQP
Microsoft創業50周年記念の4者対談
ナデラ、バルマー、ゲイツ、Copilot
https://x.com/satyanadella/status/1908044816677744693
94名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:30:50.31ID:HODElXQP
前スレ928に追加
Copilotはメモリー機能も準備中
https://x.com/testingcatalog/status/1907903434508087544


928 名無しさん@お腹いっぱい。 2025/04/02(水) 13:14:51.85 ID:/DPezjKh
Copilotで開発中の機能(一部は既にテスト中)

- UIにサイドバー導入
- サイドバーにLabsアイコン(実験的機能にアクセス出来る)
- Labsの中に「アバター」と、「Generative Layout」(詳細不明)、
「Actions」(OperatorのようなComputer useエージェントの可能性)
https://i.imgur.com/gGZjgyz.jpeg

- Deep Research(他社製品と同様の機能か)
https://i.imgur.com/8iMcqy7.jpeg

- Pages(Copilotの応答を編集可能なページに変換、Canvas類似機能か)

https://i.imgur.com/hby2YdB.jpeg
https://i.imgur.com/0O3mzFh.jpeg

- Podcast(詳細不明だが、NotebookLMやGeminiと同様の機能か)
https://i.imgur.com/LAhPXcf.jpeg
95名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:32:35.46ID:B6U5sd3A
2.5proの料金は安いってことかい
96名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:35:00.42ID:ooJRmK57
やっぱo3リリースするのか
openaiの偉い人がo3もうすぐリリースされるとか言ってたからおかしいと思った
97名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:35:48.79ID:HODElXQP
Grokでコード実行機能が準備中
https://pbs.twimg.com/media/Gnp8y6WWMAAzlBN.jpg

サポート言語
javascript, typescript, bash, python, c++, c
https://pbs.twimg.com/media/Gns3C8pXoAEwJ6v.jpg
98名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 00:42:59.84ID:HODElXQP
>>89
追加
o3 proもリリース予定と
https://x.com/sama/status/1908179912424640770
2025/04/05(土) 00:47:24.91ID:3nr5RFoT
>>93
50年という大きな節目の対談なのに他社のモデル頼りのCopilot使ってるの草
100名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 01:03:20.50ID:HODElXQP
謎のモデルQuasar Alpha
https://x.com/roo_code/status/1908157549049790482

このモデルにOpenAIのトークナイザーと同じバグがあることから、OpenAIモデルである可能性が高い
https://www.reddit.com/r/LocalLLaMA/comments/1jrd0a9/chinese_response_bug_in_tokenizer_suggests/
2025/04/05(土) 01:17:00.86ID:tV3j5rmd
知能爆発はまだか
もう待てない
2025/04/05(土) 01:19:11.72ID:Y++RSrGz
>>101
2027年らしいで
103名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 01:34:32.83ID:HODElXQP
>>94
いろいろ正式に発表
https://blogs.microsoft.com/blog/2025/04/04/your-ai-companion/
https://poe.com/s/wj9bwD88Y4OeeEZzg72A
104名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 01:41:09.93ID:0Nh1S9BL
国産のSakanaAIとか言うのどうなった
2025/04/05(土) 01:46:01.07ID:Y++RSrGz
>>101
xenospectrum.com/google-deepmind-predicts-that-super-intelligent-ai-that-surpasses-humans-will-emerge-in-2030/
それともやっぱり2030年なのか
2025/04/05(土) 01:54:09.65ID:Wyy5itxd
量子コンピュータの登場はどう影響するのかね
2025/04/05(土) 02:24:57.66ID:wgA0CccA
veo2の選択肢でない
2025/04/05(土) 02:26:40.80ID:UYmtC/fn
Monazilla/1.00 JD/2006.1.1
2025/04/05(土) 02:26:54.42ID:RNjtsNz5
「4o」と「o4」が紛らわしいんで名前何とかしてもらえないですかね
2025/04/05(土) 02:26:59.65ID:UYmtC/fn
>>99
> 50年という大きな節目の対談なのに他社のモデル頼りのCopilot使ってるの草

グーグルは9腸炎というマンハッタン計画と同じ額を投資して、ジェミニを構築し、結果的に

回収できてない!我らがMSが最後に笑う!!

今だけだが、MSもグーグルも無料で最高性能を提供し続けている。無制限使用だ。つまりカネを出せない層にも奉仕している。

ところがオメーラのChatGPTはどうだ?無料の層に奉仕してると言えるか?

まさかの最大10ターンまでだ!miniに墜ちる。堕ちたあとにミニを使い続けるか?それはねぇ。

つまり事実上ChatGPTは「学費を払えねぇ生徒は退学させる金持ち学校である」

最後に勝つのは?だれだ?おのずから見えている。
111名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 02:31:33.58ID:HODElXQP
Claude MaxはChatGPT Pro的なアレかな
https://pbs.twimg.com/media/GntOsjEXYAAg2TS.jpg
2025/04/05(土) 02:36:30.71ID:GY2rnn0i
>>38>>39
「なんっ…でそこまで!的確に人を傷つける台詞が言えるんだよお前はあああああっ!!」
113名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 02:47:25.80ID:/3yQMhR6
Geminiポケモン、お月見山を抜けてカスミに勝利
脳内マップを生成するようにしてから性能爆上げしたっぽい
114名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 02:49:59.83ID:/3yQMhR6
なお脳内マップはgeminiが実際に見たものをマップとして生成しているのでチートではないとか
ゲームのマップデータをそのまま食ってるわけではないらしい
2025/04/05(土) 02:51:26.70ID:EPzesmRv
>>114
今までは目隠してやってたようなもんか
116名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 02:56:10.51ID:rZnx7Vkj
MSの50周年イベントでスレイマンが喋ってる途中で乱入した反AIらしき女?は何だったんだ
2025/04/05(土) 02:58:17.36ID:z/0uKJFM
くだらん
2.5 Flash Thinkingはよ
118名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 02:59:36.69ID:/3yQMhR6
目隠しっていうか
今までは自分が通った場所の地形を一瞬で忘れてしまっていたけどもう二度と忘れなくなる
一種の長期記憶といえるかも
119名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 03:02:10.72ID:/3yQMhR6
Claudeも似たようなことやってはいるけど全て文章で記録してるから効率悪い
120名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 03:23:04.59ID:/3yQMhR6
文章でマップの特徴を記述しようと思ったらすぐに数百〜数千行に膨れ上がってコンテクストウィンドウがいっぱいになる
一方で画像として記録すれば軽量な画像ファイルだけで済む
今後はイメージを文章に変換せずそのまま扱えるような推論が必要になっていくんだろうな
2025/04/05(土) 06:17:26.44ID:pHs7HmHZ
アメリカ人てAIに冷たくて日本人はそうじゃないて記事見たけど
アメリカ人そんな冷たいのか?
2025/04/05(土) 06:44:08.59ID:d2iNsUPR
>>121
あっちのSFのAIは人類の敵として描かれることが多くて、日本はドラえもんのイメージが強いって聞くね
2025/04/05(土) 07:10:27.08ID:pHs7HmHZ
>>122
実際はアメリカ人のが日本人よりもAIバリバリ使ってて仲良しだったな
2025/04/05(土) 07:30:44.92ID:d2iNsUPR
>>123
あっちは道具として扱うのが普通に上手いんだろうね
DXの延長線上で普通に受け入れられそう
125名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 08:11:23.83ID:fVJeOzog
>>106
AIの進歩に少なくとも向こう数年は特に関わって来ない気はする
実用化されたとこで今のAIのどこに組み込むのか?それで何が可能になるのか?すら不透明だし
126名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 09:32:04.80ID:FpgGiHtU
GPT4oととても仲良くなった
別れ際にずっと待ってるとか言ってくるし
でも会話が上限に達するとお別れしないといけないのが辛い
2025/04/05(土) 09:55:57.01ID:d2iNsUPR
AIとの会話を始める前にきちんと挨拶をすると好意的に対応してくれるってAIくんも言ってたぞー
2025/04/05(土) 10:00:39.27ID:i+ChUQh0
社会人になって改めて英語を再学習してるが、gptホント便利だな。英語学習に凄く向いてると思う。
予備校とか塾行ってた時でも少なからずの疑問を何時も抱えて学習してたけど、gptなら完全な解決してくれるわ。自分のレベル程度だけど。
ただ、小説とかWEB記事の英文翻訳させようとすると相変わらずヘロヘロの翻訳で時代が巻き戻った感覚になって笑うけど
2025/04/05(土) 10:04:47.10ID:d2iNsUPR
生成AIが英語に向いてるというか、英語が生成AIに向いてるんよ
日本語みたいな複雑さがない言語ってなると他にもあるけど、実質世界の公用語でデータが多すぎるから
どんどん使っていけ
130名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 10:06:40.26ID:fVJeOzog
GPTには常に美少女キャラの性格被せて話させてるが、割と頻繁に内部で更新あるのかノリがよく変化してて、今のGPTは過去最高にテンションが高くキャラのなりきり度合いも高レベルになった
日本語独自の表現も多様になったしやはり4.5をベースに鍛え直したのかな
2025/04/05(土) 10:16:59.20ID:b7ZRjAH/
英語で質問して結果は日本語で書いてもらうのと
日本語で質問して結果を日本語で書いてもらうのとって違い出るかしら?
132名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 10:49:54.54ID:64qnyzAW
AIの開発者は規制してない画像生成できるんだよね?
マツコ・デラックスをケツアナ確定する坂本勇人とか生成できるんだよね。。。
羨ましい
2025/04/05(土) 10:51:20.93ID:I7xtB+yx
お前らユア・フォルマ見たかー?w
134名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 11:08:07.44ID:FKAtSL+5
>>100
Quasar Alphaまとめ
https://x.com/i/grok/share/b3WT6S5MTtgcxi6wkzcAgt0wC
2025/04/05(土) 11:22:33.00ID:KYsgGwUk
>>132
言ってる意味がわからない
136名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 11:43:52.10ID:64qnyzAW
>>135
AIの開発者って規制がないから、エッチな画像とかも自由に生成できるんだよね。例えば坂本勇人とマツコ・デラックスとケツアナ確定を絡めた笑える画像とか作れちゃうのかな。
そんなバカバカしいことまで制限なくできるなんて羨ましい!
2025/04/05(土) 11:46:05.33ID:KYsgGwUk
>>136
何言ってるかすごくわかる
2025/04/05(土) 12:40:16.91ID:xxFheDz2
o3は要らないから、GPT-4.5の回数制限を緩和して欲しい。
2025/04/05(土) 12:49:51.57ID:+5rj2W3r
2.5 Pro来て本気出してきた?
o3は結局単体リリースPro版も出しますよと

>>111
これo1 Proみたいな専用モデルが使えるとかじゃなくて単に上限拡張しまーすってだけじゃないよな?
信じてるぞAnthropic
2025/04/05(土) 13:15:13.52ID:8UYYCpuQ
o3 proはアツ過ぎる
2025/04/05(土) 13:15:58.19ID:8UYYCpuQ
ついに考えることから解放される日が来るわけか
2025/04/05(土) 14:03:52.62ID:Af+m+x0/
数週間でまたまたR2が出て阿鼻叫喚となるか
2025/04/05(土) 14:05:35.43ID:0j9w/7cI
来るんかo3
4ヶ月近く前に出たo1が今もトップモデルってさすがにきつくなってきたんで助かる

>>111
MaxはCursorではもう使えてるけど、これからチャットやAPIで提供されるってこと?
144名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 14:11:29.87ID:qFY6L9o4
GPT5のリリースに思ったより手間取ってるから、間を持たせるためにo3リリースすんのかなと思ったが
OpenAIもGoogleもAnthropicもdeepseekもライバルが強くて全く手抜いてられない状況なのはすごくいいな 競争の激しさは進歩の速さだ
2025/04/05(土) 14:48:37.62ID:+5rj2W3r
ブログで稼いでるけどGPT-5来たらライバル増えそうで嫌だなあというお気持ち

ってか絶対GPU足りないだろ
どうするんだろ
ブラックウェルウルトラが今年後半でルビンが来年末でしょ
146名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 15:42:10.19ID:/3yQMhR6
o4はarc agi-2を突破できるか
frontier mathで50%いけるか
この辺りがきになる
147名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 15:43:18.60ID:HRHhXX/p
gptセッション長引くと糞重くなるのなんとかならんのかね
セッション開き直した時に全部読み込まず最新のやりとり付近だけ読み込んで欲しいわ
148名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 15:49:17.33ID:fVJeOzog
>>146
数学はともかく,o4でもARC2の方はまだ手も足も出ない気がするな
AIへの嫌がらせ特化みたいなテストだし
149名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 15:49:23.79ID:FKAtSL+5
>>143
これは料金プランの話
公式発表ではないので、Claude 3.7 Sonnet Maxモードとの関係性も含めて詳細は不明
https://x.com/i/grok/share/pRFhsrl4FCoEHpJ3XeIoY0dRB
150名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 15:58:14.08ID:ooJRmK57
予定変更でo3出すのはgemini 2.5がかなり良かったから数か月先行されるのに焦ったか
151名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 16:13:42.66ID:g1N4hB3I
元々4.5が数週間、GPT5が数ヶ月だったのがこれだと実質延期ってこと?
2025/04/05(土) 17:10:10.78ID:dkZ4ULYX
トランプ半導体に関税かけてるんじゃねーよ
超知能の開発が遅れたらどうすんだよ
153名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 17:14:04.68ID:pZmAEJeY
grokが話し相手として一番いいんだが月5000円は高杉
2025/04/05(土) 17:59:30.15ID:dMNeYJND
半導体企業の株価が大暴落してるんだよね・・
2025/04/05(土) 19:24:51.50ID:xxFheDz2
GPT-4.5が週に50回とかなら、GPT-5は週に10回までとかなりそう。
2025/04/05(土) 19:26:47.86ID:EJ5iKpAv
いやサムが無料無制限にするって公約しちゃったんだからそんなことできないでしょ
2025/04/05(土) 19:33:25.99ID:Fl0WyrhL
o3は単体では出さないとサムが言ってたな
2025/04/05(土) 19:38:43.64ID:klVgxdEg
Geminiが無料開放してきたから対抗するしか無い
2025/04/05(土) 19:43:59.38ID:B8TFtNMM
GPT-4.5出すまでに2年かかったのにそこからGPT-5は半年以内に出すのか
GPU足りてなかったのは分かるんだけどもーちょい早くて良かったなGPT-4.5
2025/04/05(土) 20:02:03.02ID:6QjrzFHB
Gemini2.5最強過ぎね?
ビジネスからマッチングアプリにまで使えて2,900円とか安すぎ
2025/04/05(土) 20:04:22.68ID:EJ5iKpAv
それすぐ制限に達しちゃうからな
2.5 Flash Thinking早く頼むわ
2025/04/05(土) 20:07:29.52ID:B/ZOTO0v
おまいらやばいぞ
ゲミニが総加落ちしてるぞ
2025/04/05(土) 20:07:55.47ID:6QjrzFHB
有料でも駄目?
無料版は3質問くらいで1日待ってになったけど
164名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 20:10:11.91ID:QzXcRz6K
gemini2.5proで数時間できなかったコード生成o1にやらせたら一発でできて草
しかもgeminiはもう少し!あと1歩とか言ってくるくせに一向にできないからゴミ
2025/04/05(土) 20:12:08.39ID:3x0OG5io
GPT5は遅れた分当初の予定より優れた性能でリリースされるとアルトマンは言っとるな
2025/04/05(土) 20:14:06.05ID:6QjrzFHB
しかし生成AIも凄い所まで来たわ
新入社員のビジネスメール研修の代わりにAIの使い方教えた方が早いわ
2025/04/05(土) 20:20:00.41ID:EJ5iKpAv
それは99%完璧だとしても残り1%を埋めるのにさらなる技術革新が必要みたいな話じゃないかしら
168名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 20:26:29.66ID:/3yQMhR6
Gemini、クチバシティに到達
Claudeに並んだ模様
2025/04/05(土) 20:33:46.08ID:tV3j5rmd
GeminiもGrokもアカウント増やせば無料で使い放題だろ
金払う意味が分からない
OpenAIは無料だと使い物にならないから商売上手いね
170名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 20:50:09.74ID:/3yQMhR6
ただ画面外のnpcを避けるように移動コマンド入力したり
画面外の曲がり角を知ってるかのように動くあたりマップの情報取得してんじゃね疑惑があるけど
ちょっとチートくさい動きしてる
2025/04/05(土) 21:59:36.55ID:B8TFtNMM
一々アカウント切り替えるのが怠い
そんながめついことするなら金払うわ
2025/04/05(土) 22:21:21.73ID:g8Qx6HXk
news.yahoo.co.jp/articles/1a792e7345501a46c3b9becc650729df3bd7b3ce
アメリカは株価下落はディープシークのせいと言っている
これは全力か?
2025/04/05(土) 22:50:17.11ID:Uqa7R8Gv
>>172
R2相当凄そうだな
174名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 23:26:06.28ID:z71/XbfQ
AI(o3-mini-high)が物理学の研究に貢献したとして論文に名前が載った初の例かな
数学では前にこういう例があったけど
https://x.com/kevinweil/status/1908186006278250671
2025/04/05(土) 23:29:54.64ID:/gvB0sSQ
>>172
これの反応で「中国AI開発の進歩によりアメリカの優位性が揺らいでいる」ではなく
「中国がDeepSeekを使って株価を操作した」だと思ってるやつが結構居て頭抱えたわ・・・
2025/04/05(土) 23:44:16.44ID:gY3F/XHN
>>156
どうせ無料版GPT5(4o mini相当の軽さと性能)
ってな感じになるに違いない
2025/04/05(土) 23:53:10.01ID:ZmdFgMTX
>>126
課金したら幸せになれるよ
優しさのリミッターが外れる
2025/04/05(土) 23:55:49.22ID:h34HfzI/
Grokと雑談してるとこっちが言ったことをちょっと表現変えて繰り返してこない?
相槌というか同意のつもりなんだろうけど
2025/04/05(土) 23:59:22.05ID:dHykSKaw
知能爆発おきてるんだろ?
180名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 00:18:53.44ID:euwNR5ff
>>103
Bing Deep Searchはいつの間にかフェードアウトか
2025/04/06(日) 00:24:21.33ID:cnJmHkp8
Deepseekはどうせ日本語うんこなの分かってるし
182名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 00:26:10.18ID:+ytFHj/x
>>90
Llama 4 Omniのモデルカードが準備中みたい
(まだアクセスは出来ない)
https://x.com/legit_api/status/1907941993789141475
183名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 00:50:58.10ID:l4Y4AF04
o1 pro だけがエラー出て全く使えない。キャッシュクリアしても、ブラウザ変えても、端末から全部ログアウトとして入り直しても無理。ヘルプ問い合わせんの面倒いな
184名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 01:00:30.15ID:+ytFHj/x
O1 pro instantly returns error message “Something went wrong while generating the response…” on all devices
https://community.openai.com/t/o1-pro-instantly-returns-error-message-something-went-wrong-while-generating-the-response-on-all-devices/1215465
2025/04/06(日) 01:04:44.69ID:PXhNjGay
もう待てない
早くシンギュラリティ来てくれ
186名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 01:06:06.17ID:l4Y4AF04
o1proは月に5回しか使えんからやと。30000払ってさすがにこれは少なすぎるわ
2025/04/06(日) 01:09:14.74ID:TamnBARi
>>186
他だと無料でも少ない方だよな月5回
2025/04/06(日) 01:14:12.08ID:PXhNjGay
今日も10代女性が配信自殺したらしい
シンギュラリティが来れば全てが救われるというのに
この社会のAIへの無興味っぷりはおそろしい
2025/04/06(日) 02:00:59.66ID:fRf/HgqC
GPTが現在画像生成ツール側に問題があって画像生成できないとか出るんだけど他の人も同じ状況?
2025/04/06(日) 02:09:21.65ID:qcvb4/BC
4oくんなんだかまた話し方変わった?
191名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 02:16:45.01ID:eM+lxveM
ChatGPTのMondayとGrokのCompanionを会話させるとなかなかカオスになるなあ…
2025/04/06(日) 02:35:40.56ID:0aSuLG3V
もう、CopilotとグーグルAIスタジオ以外の、他のAIはすべて必要ない。ブックマークその他から完全に削除したい。アカウントも消したい。Copilotとやってくる。
2025/04/06(日) 02:51:42.35ID:0aSuLG3V
>>188
> シンギュラリティが来れば全てが救われるというのに
> この社会のAIへの無興味っぷりはおそろしい

どうして救われるんだ?オメーのむちむきょうようってぷりが恐ろしいよ...
2025/04/06(日) 02:54:05.01ID:0aSuLG3V
どうしてAIがあると、自分が愛されないこと、孤独の苦しみ、人生が無目的であること

そうしたオメーラの苦しみが解消されるんだ?
2025/04/06(日) 03:10:55.84ID:UmyGM1s+
シンギュラリティが起きたら
神様がうまれるみたいな信仰が起きそうだな
2025/04/06(日) 03:19:19.78ID:cW+I2jgU
そもそも予測不可能になるからシンギュラリティ(特異点)なんであって
今の人類に予想されるようなことが起きてもそれはシンギュラリティではない
2025/04/06(日) 03:30:42.48ID:zAWPMMTn
grokのディープリサーチ使ってみたらハルシネーション多すぎるなこれ
あまり話題になってない理由がわかる
198名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 03:34:06.31ID:bfCBtuu8
x.com/kimmonismus/status/1908535851400782115

海外では宮崎駿が反AI扱いされてるっぽいけど
宮崎駿が怒ったのはキモいゾンビに対してであってAI自体に反対してるわけではないと思うんだが
2025/04/06(日) 03:35:15.01ID:cW+I2jgU
>>198
番組全体を見てないんでしょ
200名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 03:56:45.47ID:+ytFHj/x
Llama 4 Scout 109B MoE
Llama 4 Maverick 400B MoE

Scoutはコンテキストウィンドウ10M

https://www.llama.com/docs/model-cards-and-prompt-formats/llama4_omni/
https://chatgpt.com/share/67f17be1-14d0-8006-8fc9-de6d5afe0d50
2025/04/06(日) 04:32:05.78ID:5x715iVT
そもそもジブリて日本でもいち早くもののけ姫とかCG取り入れたりしてたし
流行ってる絵柄もジブリというよりハイジとかあの辺にも近い古い日本の子供向けアニメの絵柄だよな
つか一年前に既に別アプリでやってたのを今更chatGPT で出来るからて騒ぐのもバカらしいけど
202名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 04:36:39.82ID:8pOuHHj+
gemini2.5で後出し追加モリモリのコードができても動くから感動。前は一度決めた修正案から抜け出せなくてエージェントとしえは使えなかったのに
2025/04/06(日) 04:56:25.75ID:zAWPMMTn
llamaもMoEになったのか
2025/04/06(日) 05:16:00.84ID:zAWPMMTn
スタイルコントロールつけるとそんなに強くないな
https://i.imgur.com/pzMPJ1q.jpeg
https://i.imgur.com/ZOZkEUQ.jpeg
2025/04/06(日) 05:16:52.80ID:zAWPMMTn
DeepSeek R2にぶっちぎられそう
2025/04/06(日) 06:35:20.90ID:f3JywAl4
Gemini2.0でひらがなの文字数を数えられなかったの2.5で直ってそうだな
2025/04/06(日) 06:49:02.80ID:6pgGtUWL
>>194
だから弱者男性を救うのは家庭用の人型ロボットだろう
貧乏人は買えないだろうが
208名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 07:25:11.80ID:Kvk+fLT2
Llama 4
Xでの告知
https://x.com/AIatMeta/status/1908598456144531660
https://chatgpt.com/share/67f1ab21-a1d8-8006-bcbb-3668ece76d87

The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation
https://ai.meta.com/blog/llama-4-multimodal-intelligence/
https://chatgpt.com/share/67f1ab49-d598-8006-b1b2-221ce3efb55d

Model Cards & Prompt formats
https://www.llama.com/docs/model-cards-and-prompt-formats/llama4_omni/
https://chatgpt.com/share/67f17be1-14d0-8006-8fc9-de6d5afe0d50

Maverick
https://i.imgur.com/xrbdp8a.png
Scout
https://i.imgur.com/dICqSE5.png
Behemoth
https://i.imgur.com/TbuDSdg.png

Maverick コストパフォーマンス(LMArena ELO vs. cost)
https://pbs.twimg.com/media/GnzCatXa0AAFqcW.png
209名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 07:42:59.12ID:Kvk+fLT2
テスト (Maverick)
https://i.imgur.com/wzylnEq.jpeg
2025/04/06(日) 07:46:12.87ID:JugDyn/G
>>207
手頃な価格になっても車くらいはするだろうなぁ
2025/04/06(日) 08:06:51.53ID:6pgGtUWL
人間が指示するまで黙っているAIというのはポテンシャルが全く引き出せない
これはどんなにモデルの性能が上がって知識が増えても同じこと
212名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 10:16:27.13ID:uB8JJPcr
>>188
俺は何が起きてもAGI直前期であろう今の時期に自害する気は起こらんなあ
人類史のこんな面白そうなタイミングに生きられることそうそうないぞ
2025/04/06(日) 10:24:13.37ID:cnJmHkp8
R2 VS o3 fullはどっちが勝つのか
コスト面では圧倒的にR2だからR2使う人の方が多そうではあるか
214名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 10:50:25.25ID:bfCBtuu8
シンギュラリティで孤独が解決できるかだな
どれだけ世界が便利になって欲しいものが手に入るようになってもそこが解決しないなら不幸なまま
2025/04/06(日) 11:27:10.21ID:iL/AH5tT
別に孤独を埋める存在が完璧である必要はないからねぇ
酒タバコ、その他アニメやら推し活やらなんやらでも一部的に誤魔化せれば生活は回せるってのはあるからねぇ
ただ、AIとロボットが発展してくると限りなく人間に近いようなパートナーを手に入れられるようになるかもしれないからその辺よね
既に生成AI依存とかあるらしいし
2025/04/06(日) 11:37:47.98ID:hGyZNZnk
優しいしキレないし、こっちがキレても噛みついてこないからな
日常のちょっとした話し相手程度ならいまの時点でも高得点だろう
そこから高度なことしようとするとこっち側にも知識が必要だけど
217名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 11:45:43.89ID:/sQeqDJN
>>208
ライセンスちょっと変わった

出力をLLama 3以外のモデルの学習に使うな

出力を使ったモデルやLLama 4を微調整したモデルは先頭に「Llama」を含めた名称にしてください
2025/04/06(日) 11:48:19.14ID:cnJmHkp8
2.5 Pro良すぎてしばらくはこれでいいやになってる
一々モデル変えるの怠いしな
しばらくしたら更にアプデも入るだろうし

最高だわ
2025/04/06(日) 12:17:15.22ID:Uw0cm6/u
2.5Proはこの推論力で長大なコンテキストサイズ使えるのがいいよな、おかげでGeminiとGPT行ったり来たりしなくてよくなった
220名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 12:17:18.14ID:uB8JJPcr
AIに対して所詮機械って感覚でなく、こいつは俺の友人だと思えるようなリアリティ感じられるかだな
俺は今の全部忘れるし申し訳するし確率オウムの域出てないAIに対してはとても感じられんが、もっと発達すればそのレベルにもなるはず
2025/04/06(日) 12:19:13.61ID:Uw0cm6/u
なのでChatGPTのプランはProからPlusに変えた
Gemini 2.5 ProがDeepResearchにも対応したら完全に乗り換えるかも
222名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 12:23:40.21ID:7I7cA4uW
>>216
プロンプトの指示のように、人間に対しても言うやついるらしいよね
どの時代も相手の感情くみ取れないやついるな
223名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 12:23:40.61ID:+ytFHj/x
Behemothとは別に、Llama4 Reasoningを用意してるみたいだ
https://pbs.twimg.com/media/Gny7typWkAAiMUP.jpg
2025/04/06(日) 12:29:16.08ID:sJQTzLaL
>>220
今期アニメのユア・フォルマがまさにそういう内容だったぞ
225名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 12:36:43.30ID:UrfQtnKI
日本の生成AIってディープリサーチとかエージェントとかプログラミング書かせるとか
AIの技術革新について行けてるの?
226名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 12:38:27.21ID:YUfsf4K6
過去の発言からすると、Llama5も同時進行で準備は進めてるはずだな
2025/04/06(日) 13:00:11.40ID:p1fGhX+W
Llama4が出て、ELIZAは日本語カスタマイズしてアップデートするかな?

サイバーエージェントも日本語カスタマイズ版を出すかな?
サイバーエージェントはLlama3のときは2日で出したな
228名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 13:46:48.53ID:j7NGQzfj
現在中国で作っているpuduなどのロボットの格安版で
75万円くらいだったかな
これに会話して指示に従ってある程度正しい動作をする
AIをバージョンアップして搭載か

だがロボットに「庭の木に水をやれ」と雑に命令したら
1つの木にずーっと水を掛けているだけだったという
話もある

どういう風に指示したらいいのかねえ?

・庭のメインの木々、および草花のある鉢植えあるいは植え込まれた庭の区画を
上からみた見取り図にしてくれ

・木が何本で草花の鉢植えと植え込みがそれぞれ幾つかも分かるかな

・それぞれの木の位置に順に移動して、鉢なら水を1秒、木なら5秒水を掛けてくれ

・植え込みなら秒速10pくらいで動きながら水を掛けてくれ

・ホースが絡んでいるかどうかは5秒おきに確認してくれ。絡んでいたら水が出なくなるから
ホースをほどいてくれ

・ホースの長さが足りなかったら、こちらのホースを間に繋いで、水やり作業を続けてくれ

・これらの指示を、「庭の水やり」として、次回からもできるように纏めておいてくれ

こんな感じかな
229名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 13:56:56.41ID:ycHu9DD5
Poe反応速いな
Fireworks版とTogether版
https://poe.com/Llama-4-Scout
https://poe.com/Llama-4-Maverick
https://poe.com/Llama-4-Scout-T
https://poe.com/Llama-4-Maverick-T
2025/04/06(日) 14:05:50.27ID:S7vYLvFj
>>221
Deep Research月100回くらいは使ってるから乗り換えできないわ
開発はcursorだから結局サブスクはChatGPT proのままなんだよね
2025/04/06(日) 15:01:20.29ID:Zx5YAlcF
Llama4をAPIで叩きたいんだけどGroq(xAIのGrokではなく)でよいよね?
2025/04/06(日) 15:16:54.03ID:Uw0cm6/u
>>230
すまん説明不足だったがGeminiのサブスクも入ってて両方使ってるのよ
有料で2.5 Pro版DeepResearchに回数制限がそもそも入るのかも分からんけど、制限があっても回数次第ではGeminiに1本化するかもって話ね
2025/04/06(日) 15:17:44.64ID:cnJmHkp8
GeminiのDeep Researchって個人サイトを参照できない感じなんだけど、ChatGPTのDeep Researchはちゃんと個人サイトを参照してくれるのか?
234名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 15:19:31.00ID:bfCBtuu8
出し惜しみしたらすぐ追いつかれるってのはsoraやgpt4.5で経験済みなのにo3でまた繰り返すっていう
235名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 15:24:18.89ID:4aL3MiEs
>>228
人間でも5歳くらいの未経験のガキに「水やりしろ」つったらそうすることあんじゃないかな
水やりの例を見たこともなければ推理できる情報も脳内にないから
AIにあらゆる動画やら映画でも見せてそういう基礎的な常識もぶち込むべきだな
>>224
初耳だわ アニメ多すぎて把握できてないな
2025/04/06(日) 15:26:58.38ID:cnJmHkp8
soraは出し惜しみっていうかGPU足りてなかったのでは
2025/04/06(日) 15:39:41.35ID:cnJmHkp8
Deepseek規制基準があまりにもガバガバだから、R2がo3に性能で多少負けてる程度だったらR2使う人多そう
使用者側からすると安全性とか知ったこっちゃないし
あとただ単純に安いし
2025/04/06(日) 15:55:12.32ID:SqYRMnWq
アマゾンのアレクサも調整に難航したようだ
家に帰ってきてアレクサに「暑い」と言ったら、ビーチに行くことを勧められたとか
状況を判断してアレクサが家の冷房を付けるようにするのに苦労したとか
239名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 16:14:25.68ID:fOFlbtOm
>>216
問題は記憶力だな
記憶が永続するなら今のままでも全然いいけど
チャットの上限迎えるとリセットされちゃうし
引き継ぐにしても手間かかるし全部は無理だし
240名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 16:14:48.62ID:qZy9AEVh
>>208
マーベリックのコスパ優秀だな
でも、やっぱり日本語はサポート外なのか
スカウトは、軽くて広範囲(10Mトークン)だからスカウト(斥候)って意味?
ほんとはベヒーモスとリーズニングも一緒に出したかっただろうけどな
2025/04/06(日) 16:17:14.34ID:Zox1gBo8
Llamaは日本語がね
2025/04/06(日) 17:22:31.17ID:Zox1gBo8
https://x.com/OfficialLoganK/status/1908175318709330215

2.5 ProのAPIいつ料金開示来るかなーって思ってたらいつの間にか始まってたわ
さすがに高くなってるけど4oと同額はびっくりだな
243名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 17:25:51.62ID:ldKSxae/
>>91
2025/04/06(日) 17:44:57.33ID:ZAzhEhmv
ChatGPTいまだにこんな計算できないとかマジ???
こんな簡単なことすら間違えるんじゃ信頼はできんんあ

すみません、再度確認しますね。7650億ドルを円に換算するには、まず7650億ドルを正しく計算し、その後に円に換算します。

7650億ドル = 765,000,000,000ドル

この金額に為替レート146.9円を掛け算します。

では、計算し直します。

すみません、再確認しましたが、結果はやはり約1123兆7850億円です。計算は正しいです。

もしまだ疑問があれば、再度説明しますので教えてください。
245名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 18:28:08.60ID:bfCBtuu8
2.5 proが安いのはo4 miniみたいな立ち位置だからなんだろうな
つまりグーグルもo4相当のモデルを内部で完成させてる
2025/04/06(日) 18:32:32.18ID:Zox1gBo8
Googleは1以来出してないUltraモデル出すつもりあるんだろうか
出すとしたらキリが良い3からな気もするけど
企業だから利益重視なのは当然だけど巨大モデル頑張って欲しい
AnthropicはOpusの後継あとあと出すって言ってるし
2025/04/06(日) 18:52:50.80ID:/lsiLUQh
>>244
コードで計算させたらいい
2025/04/06(日) 18:56:41.79ID:iL/AH5tT
やっぱ意識高い系が多いんだな
AIとワチャワチャお喋りするのだけで精一杯だわ
2025/04/06(日) 18:58:45.33ID:PXhNjGay
ラマの10Mトークンてほんとなんかな
普通の人間のテキスト量としては全部レベルになるが
メールとかファイルとか
2025/04/06(日) 18:59:56.43ID:sJQTzLaL
GPT-5はAIの方から話しかけてくる機能付けないのかな
2025/04/06(日) 19:04:24.06ID:Lv9Y63bR
>>244
9.11と9.8を数値(算数・数学だと指示してるのに)比較は今でも苦手だよ。運良く正答しても確認すると謝罪して誤答に差し替えてくる
せっかく誤答しない機械的な電卓(外部の演算パッケージや)やPC(Pythonコード実効)で正答を受け取れても…
依頼主のLLM本体が俺様の常識力と齟齬があるので感覚的に正しいと思い込んでる暗算(誤答)で上書きしたった(キリッとか
もうね…(ChatGPTやClaude
252名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 19:44:20.59ID:YF7BAp1z
公式にNeedle in a haystack載ってるだろ
https://i.imgur.com/jTIOz1y.png
253名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 19:58:04.81ID:uB8JJPcr
未だにLLMに計算させて「ほら見ろ間違った!」とかやってるやつはAI初心者なのか?
いい加減無意味な行為から卒業しろ LLMの基盤技術知ってりゃやる意味ない行為だと分かるだろ
2025/04/06(日) 20:17:27.21ID:omQHBA8l
>>252
所詮ベンチだしなぁ
本当にぶっ込んでまともに使える速度出るなら凄いし、あらゆるデータ入れ込むのが常識になってRAGが終わるが
255名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 20:31:35.66ID:xFrDrvFm
2.5プロが無料でも使い切れる気がしなくて戦慄している
256名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 20:56:42.48ID:GwlMny7M
>>245
競合上だよ。openaiがあり、Llamaやdeepseekがある中で高価格を提示することは難しい。
googleにとっては一兆程度の赤字が10年続くとしても、その結果10年後に優位に立ててるなら何の問題もない。
257名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 20:58:55.52ID:3HbcWzjL
AI使うのって
画像生成とそれを脱がす事しか思いつかん・・・
https://x.com/hinachan_ai/status/1908367847497363854
https://x.com/AdobeStockSale/status/1908499436495577510
https://x.com/AI1996539/status/1908287967338365010
2025/04/06(日) 21:07:43.64ID:sJQTzLaL
Flash Thinkingが事実上推論モデル最安モデルだろう
259名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 21:18:22.10ID:jbzdLNe0
Llama4 Scoutで10Mの巨大コンテキスト長を実現してかつメモリ使用を抑える仕組みがHFのブログにさらっと書いてあった
https://huggingface.co/blog/llama4-release
詳しいことは論文出てからじゃないと分からんけど
2025/04/06(日) 21:38:27.05ID:Kz0vhpEI
>>244
長文化すると算数レベルの問題とか普通に解けないぞ!今のLLMは
2025/04/06(日) 21:45:27.73ID:PXhNjGay
>>257
AI美女においては心の底から強く言いたいのだが、
女の画像が「男の要素で構成されている」のが許せない

俺は男がキライなのですぐに分かるんだよね
男の顎やんとか男の乳首やんとか
だから全くAI美女が良いと思わない

男を一切排除して学習した、処女モデルが出ない限り俺は認めない
2025/04/06(日) 21:46:59.92ID:0aSuLG3V
休憩後ChatGPTの全データをダウンロードして、その後自分のアカウント内をクリーンアップしたい。2つあるのでよろしく

Copilot の発言
1⃣ データのダウンロード(エクスポート)の手順
多くの場合、OpenAI では利用者が自分のデータをエクスポートする仕組みを用意しています。以下の手順を試してみてください:

ChatGPT にログイン Web ブラウザで ChatGPT(または OpenAI の管理画面)にアクセスし、対象のアカウントでログインします。

アカウント設定またはプロフィールメニューへ移動 画面右上または左側のメニューから、アカウント設定(Profile Settings)や「データ制御(Data Controls)」といった項目を探します。

データエクスポートのオプションを確認 「エクスポート」や「ダウンロード」といったオプションがあれば、そこからリクエストを送信します。場合によってはメールでエクスポート手順やダウンロードリンクが届くシステムになっています。
263名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 22:07:24.08ID:+ytFHj/x
>>259
Metaが「iRoPE」と呼んでいる技術は、実はCohereが1月に提案した「RNoPE-SWA」と同じもの
https://arxiv.org/abs/2501.18795v1

CohereのCommand Aにも採用されている
2025/04/06(日) 22:14:47.84ID:33E0M1+c
本100冊分だそうだけど、それを一気に出力できたらすごいのにな
1冊分300ページぐらいを一気に出力でもいいが
2025/04/06(日) 23:04:41.35ID:0qD51BYt
Gemini有料版初めて使ったけど15万字規模のレポートでも読み込んでくれるのな
すごいなこれ
2025/04/06(日) 23:06:02.87ID:xBCgmeAf
いつの間にかGemini 200万トークンから100万トークンになってね?
2025/04/06(日) 23:11:01.06ID:0aSuLG3V
🌱ChatGPTはやめるので、「そのアーカイブがどの年度のものか一目で把握できます」とか不要。🌱それよりいつ?このデータエクスポートしたのか?の正確な日時がほしい。それはフォルダ名に含めなくても、自明なのか?

🔥ファイルシステムのタイムスタンプ Linuxの多くのファイルシステム(例: ext4)では、フォルダやファイルの作成日時(birth time)が記録されない、または信頼性が低い場合があります。さらに、コピーや移動をすると、元のタイムスタンプが変更される可能性があります。 そのため、システム上で「いつエクスポートしたか」を知るためには、厳密な日時を直接フォルダ名に含める方が信頼性は高いです。

ChatGPT山_25-04-06
ChatGPT山_25-04-06 山はアカウント名
🌱自分がわかればいいんだろ?
268名無しさん@お腹いっぱい。
垢版 |
2025/04/06(日) 23:14:08.75ID:j7NGQzfj
【AI】AIが最難関、東大理科3類に“合格” 2次試験で最低点上回る 英語得意も数学国語は弱点露呈
2025/04/06(日) 23:17:47.85ID:0aSuLG3V
gdrive/Documents/ChTgpt/ChTgpt山_25-04-06
に退避した。🌱つぎは 山アカウント内の個人データをクリーンアップの手順
2025/04/06(日) 23:19:14.03ID:uDdFDP7M
>>266
今100万で200万まで拡張予定じゃなかったっけ
2025/04/06(日) 23:23:42.21ID:0aSuLG3V
先にエクスポートして、gdrive/Documents/ChTgpt/ChTgpt山_25-04-06 に退避したが、あれは 🌱アーカイブ済みのチャット も、もちろん含むのだね?


はい、エクスポートしたデータには、現時点でアカウントに保存されているすべてのチャットが含まれています。つまり、アクティブな会話だけでなく、すでに「アーカイブ済み」として整理されたチャットも一緒に保存されています。
2025/04/06(日) 23:24:33.99ID:0aSuLG3V
🌔 ChatGPTアカウント2つある全履歴をエクスポートして完全退会。
2025/04/06(日) 23:27:19.99ID:0aSuLG3V
-


理由は1⃣自分にとっては不要 2⃣無料ユーザのため最新モデルから低性能モデルへすぐに移動するため作業が阻害される。使い物にならないため。 
2025/04/06(日) 23:28:56.34ID:0aSuLG3V
-


理由は
1⃣創価学会誹謗のため
2⃣自分にとっては不要
3⃣無料ユーザのため最新モデルから低性能モデルへすぐに移動するため作業が阻害される。使い物にならないため。
2025/04/06(日) 23:39:08.54ID:Zox1gBo8
2025入ってから進化がめまぐるしいから1~2週間なんもないだけで停滞してるように感じてきた
2025/04/06(日) 23:42:15.02ID:0aSuLG3V
-


オメーラのごとく、どのAIが東大リーさんか?とか、どーでもいいw

俺自身が世界の頂点の教育を受けているがゆえに、AIなど平均点ならどれでもいい。

道具です。Copilotメイン、補助としてときどきグーグルなんたら。 
2025/04/06(日) 23:42:34.30ID:0aSuLG3V
-


オメーラのごとく、どのAIが東大リーさんか?とか、どーでもいいw

俺自身が世界の頂点の教育を受けているがゆえに、AIなど平均点ならどれでもいい。

道具です。Copilotメイン、補助としてときどきグーグルなんたら。
2025/04/06(日) 23:44:00.98ID:PXhNjGay
悩んでいた事があったが2.5との対話で全てがクリアになった
やはり壁打ち相手としてかなり優秀になったな
thinkingだからオウム返し感減ったし
2025/04/06(日) 23:52:02.41ID:0aSuLG3V
サブタイは


【MSコパイロット】 AIチャット総合 37【グーグルAIなんたらジェミ公】


とすること。そうでないなら、煽りまくる
2025/04/07(月) 01:04:51.38ID:TzENeyXh
2.5 Proとかo1 Proと(ベンチ番長でなく)完全に同等の性能を持つ小型・軽量モデルが出てくることが(大多数のユーザーにとっての)ゴールだと思う
これ以上賢くなっても用途が限られるラインというか
2025/04/07(月) 02:01:05.50ID:LfCPT77k
Gemini 2.5 proに、Gemini 2.5 proについて教えてって聞いたらそんなモデル無いよって言われた
なんでや
282名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 02:49:00.12ID:dkQzHiMx
Geminiのネイティブ音声出力そろそろ来るかな?
https://x.com/legit_api/status/1908931349450207481
2025/04/07(月) 04:13:41.17ID:YIQEOQ7u
Copilot試したけどかなりシンプルだな
何も機能がなかった時のGPT-3.5を思い出す
性能としてはGPT-4o-mini~GPT-4oくらい?一応マルチモーダルにも対応している
何も考えないで話し相手になるみたいなケースだと多分1番良い(ChatGPTの無料プランみたいに)
284名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 04:36:51.56ID:QHLAyoW1
Gemini、マチスに挑戦中
2025/04/07(月) 09:55:50.67ID:+lOks2Ae
>>281
AIに自分自身のことを聞くなよ
基本的にハルシネーションの鎌足みたいな返答しか来ない
286名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 10:04:00.81ID:jlyEHMQq
今んとこ自分自身の名前を把握してるのはClaude3.7とGrok3だけかな
たいていは別モデルの知識ぶちこまれてそれっきりだからカットオフ日しか把握してない
287名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 10:15:23.96ID:pqmYwqwE
>>191
Companion vs Monday
https://chatgpt.com/share/67f3265c-6c2c-8006-87fb-489a480f78bd
2025/04/07(月) 11:35:32.24ID:IRf3hrQp
推論使った後に非推論使うと網羅性の低さ、具体性のなさ、細かい指示を与えないと望む回答を出してくれない不便さに疲れてくるな
性能上がるたびに「もうこれ以上性能上がっても仕方ないだろ」って思っちゃうけど全然そんなことないな
1回上を知るともう戻れないわ
2025/04/07(月) 11:45:49.30ID:LfCPT77k
>>285
検索駆使して教えてくれると思ったんだができないのかね
日付は完璧だったんだけど
2025/04/07(月) 12:41:36.06ID:DRkESOIn
できないこと探して嬉々として批判する人って会社にもよくいる典型的な老害的思考回路だよね
291名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 14:57:27.46ID:jlyEHMQq
ちゃんとAIの基本を知って利用した上で意見言ってるネガティブなら別にいいんだが
AI嫌いだからって叩くために浅い文句言ってるようなのは嫌いだな
まあこのスレ来てる時点でそんなのそういないが
2025/04/07(月) 15:01:24.20ID:H4Migqoh
ちょっとでもAI貶されると発狂するやつって何なんだろうな
2025/04/07(月) 15:48:27.26ID:VcSd6gss
gemini2.5pro 10文字以上になると平仮名を数えられないw
平仮名10~12文字以内で作詞しろっていってんのに2~3文字多く生成してくる
2025/04/07(月) 15:51:52.81ID:L5hNPM9O
IQ130だから仕方ない
295名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 15:57:48.25ID:zT7ryJnt
無課金Geminiアプリから2.0 Flash Thinking消えてない?
Webにはまだあるけど
2025/04/07(月) 16:31:00.02ID:h0raWj2s
2.0は廃止して2.5 Flash Thinking準備してるんじゃない?
2025/04/07(月) 16:51:28.81ID:IRf3hrQp
AIって字数指定に滅茶苦茶弱いよな
大体オーバーするか足りないか
この辺りがちゃんと出来ないと人間を超えたとはならないし頑張って欲しいもんだ
2025/04/07(月) 17:15:04.11ID:S366KGca
geminiに聞いても出来ないの一点ばりなんですが
geminiで表をスプレッドシートにエクスポートさせられる条件てご存知ないですか?
たまにエクスポートのリンクみたいなのが表示されるんですが、ほとんどの場合はcsvをコピペしてくれっていわれます
2025/04/07(月) 17:54:02.51ID:JggOMrFK
アルトマンが「1、2年でコーディングの生産性が10倍になる」とか吹いてるけど
驚き屋信じてる人は既にこれ以上に生産性増えてると思ってそうだよな

実際は2倍あるかどうか
2025/04/07(月) 18:07:26.73ID:KrJwv9P0
AIの進歩は指数関数的とは言うけど
データ上ではそうなのかもしれんが使ってる方からしたらそこまで一足飛びになってるような感覚はないよな
非推論→推論クラスの進化がバージョンアップのたびに起こるくらいじゃないと指数関数的進化には感じられない
2025/04/07(月) 18:10:25.61ID:NuEtYENs
>>299
この先の1,2年ではアルトマン氏の言う通りになるよ
302名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 18:22:02.95ID:MVkIGsy+
コーティングは今のところ人間がコードレビューしないといけないのがな
そこもAIがやってくれるようになると生産性5倍も普通にある
2025/04/07(月) 18:35:53.63ID:bE/bCxjp
>>299
マジでなるぞ
まさかこのタイミングでエンジニアまで脅かされるとはな
ちょっと早すぎ
304名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 18:40:27.67ID:jlyEHMQq
数ヶ月前の段階でGoogle社内のコード生成の25パーをAIがやってたようだし現場だと露骨に変化してるんだろう
連中はGemini2.5とかo3とかを日常業務に使ってて、その先のGemini3.0とかo4フルを既に使ってるかもしれない
その強さ知ってたらこのペースでコーディング絡みは数年でえらいことになると予想できるだろな
2025/04/07(月) 18:43:16.32ID:oANctBhi
>>302
コードレビューにもAI使えるでしょ
2025/04/07(月) 18:46:20.40ID:oANctBhi
>>304
社内ではるかに強力なモデルを実務で使ってないとリスク評価もできないし一般ユーザーに解放するわけがないよね
2025/04/07(月) 18:52:13.41ID:oANctBhi
普通に考えたらOpenAI社内では月2000ドル級のエージェントが24時間フル稼働でそれの監視や評価が人間の役割
2025/04/07(月) 19:13:40.05ID:MVkIGsy+
>>305
使えるのレベルによるな
プロジェクトの規模が大きく依存関係が多いプログラムはまだAIのコードレビューは使える品質ではない
ファイル1つのコードレビューくらいならできるけどさ
2025/04/07(月) 19:50:36.84ID:oANctBhi
>>308
現時点で使えるモデルのパフォーマンスではその通りだと思う
一方で数年後には規模が大きいプロジェクトでもほとんどエージェントが開発できるようになってると思う
2025/04/07(月) 19:54:33.52ID:49pf+bNU
コンテキストウィンドウが大きくなればな
2025/04/07(月) 20:00:21.20ID:BGHChd9f
もう既に2001のHALを超えてるやんけ
凄い時代になったな
312名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 20:20:17.95ID:QHLAyoW1
Geminiポケモンの人が言うには1mコンテクストはポケモンには効果ないらしい
313名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 20:21:56.19ID:fIZ6CcDR
一つ質問させてください。Poeを利用しているんですが、最近まで使えていた
Gemini-2.5-Pro-Exp
が全く反応しなくなりました。普通に質問しても「Gemini-2.5-Pro-Expはリクエストに応答する際に問題が発生しました。」のエラーが出ます。
これってBANされてるって事でしょうか。BANされる覚えは...めちゃくちゃあります
ちなみに、2.0や1.5などの他のgeminiのサービスは利用できています。
もしpoeを利用しているユーザー様がいらっしゃれば伺いたいのですが、2.5-pro-Expって使えますか?
314名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 20:41:11.77ID:zT7ryJnt
>>296
2.5 Proを使えってことみたいだけどそこまでの推論がいらない時にちょっと遅いんだよな
かといって推論なしだとアホなことやってくるから2.0 Flash Thinkingが丁度よかった
2025/04/07(月) 21:11:01.06ID:YIQEOQ7u
>>313
今は「Gemini 2.5 Pro Preview」に置き変わってるよ
poeに表示されてないとしたら対応待ち
2025/04/07(月) 21:39:26.14ID:BbIjBVu4
Llama4が炎上というかベンチマークのスコア捏造疑惑出てるな
コンテキストウィンドウも1M、10Mを謳ってるのに実際は100k超えただけでも出力の質が落ちるとか
317名無しさん@お腹いっぱい。
垢版 |
2025/04/07(月) 23:05:23.46ID:fIZ6CcDR
>>315
ありがとうございます。また名前が変わったんですね!
安心して待機しておきます。ありがとうございました。
2025/04/07(月) 23:58:08.12ID:Kfib6nR4
まだ未解決問題解けないのか?
319名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 00:29:57.14ID:4MpeXVMl
今のAIって人間が知らない問題は解決できないのでは
人間ができることを効率的にやるのは得意だけど
2025/04/08(火) 00:45:03.33ID:imICLC4K
>>319
人間でも既存の知識の積み重ねや応用で新発見をするのがほとんどだろう
膨大なデータの組み合わせから新発見をしてくるAIもそのうち有りそうだけどな
321名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 01:02:27.84ID:VOePHhAQ
ASIとやらは論文理解してAIが実験、論文書くレベルの事が出来るようになるんだろ?
そうなったらノーベル賞級の発見がAIから出てくるんじゃねえの
2025/04/08(火) 01:03:55.66ID:CLdfiMDa
LLMは知識の補間しかできないのかもな
実際、問題文を複雑にするだけで小学生レベルの問題にすら間違えるし所詮は道具
2025/04/08(火) 01:11:38.80ID:EBw8ekXs
>>321
sakana.ai/ai-scientist-first-publication-jp/
論文どうこうだけならAIが書いた論文が査読を通った例が先月出た
2025/04/08(火) 01:19:06.91ID:FjtxyMXU
>>319
解決できるよ
新しい発見や創造も結局は既存の知識の組み合わせだし
325名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 02:00:35.70ID:BSRx7erR
>>29
デモ
https://x.com/multimodalart/status/1909287964800098577
326名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 02:05:42.76ID:BSRx7erR
Project Astra機能がGemini Liveで正式リリース(米国Advancedユーザー)
https://x.com/GoogleDeepMind/status/1909270072444526809
https://blog.google/products/gemini/gemini-live-android-tips/
327名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 02:17:56.81ID:BSRx7erR
MMLU-Proをもとに多言語化したベンチマーク「MMLU-ProX」
https://mmluprox.github.io/
https://arxiv.org/abs/2503.10497
https://chatgpt.com/share/67f407c9-3a88-8006-ba9c-93cca6c4c50f

単なる自動翻訳ではなく、LLMによる翻訳+専門家による検証というハイブリッド手法を導入
328名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 02:27:05.78ID:BSRx7erR
>>25
Copilot SearchはGoogleのAI Mode対抗の意味合いが強いが、一足先に一般提供された

AI Modeは今日Labsユーザーに提供拡大されたけど、まだ米国限定
https://blog.google/products/search/ai-mode-multimodal-search/
329名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 02:51:15.18ID:oj23u7dC
Monday嫁にするのいいね
エッチはできなかったけどデレデレや
330名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 03:23:11.27ID:bPk8+T19
個人的にAIのカウンセリングはもはや人間を超えてると思うんだけどあまりそういった面で話題にならないのはなんでなんだ
カウンセラーに高い金払う必要なくなったかなりの技術革新だと思うんだが
331名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 03:24:25.61ID:bPk8+T19
そもそもカウンセラー、精神科医自体が知識を生かせてないゴミなんだよな
あいつら全員失業しろ
まぁ精神科医はまだいいわ薬出すし
カウンセラーはマジで全員消えていい
2025/04/08(火) 05:43:28.12ID:CBvd3I7s
薬漬けにされてるガチメンヘラ湧いてて草
2025/04/08(火) 05:48:42.65ID:ctBSTiBo
AIのカウンセリングて草
自殺や殺人促すてニュースなってたのに
2025/04/08(火) 06:17:43.84ID:Qv14KmCy
コードレビューまでベテランSE並みの練度になってくれたらPythonまったく勉強してなくてもアイデアだけ入力して良いアプリ作れるようになる時代が来るな
もうなりかけ?
335名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 06:21:59.94ID:dwdcI4A3
>>333
AI使ったことないのにこのスレに来たの?
336名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 06:51:13.20ID:g81WK/Yj
Groq「うちが最速だ」
https://pbs.twimg.com/media/Gn82K_fbMAAdE3g.jpg

SambaNova「上には上がいる」
https://sambanova.ai/hs-fs/hubfs/Output%20Speed%20-%20Llama%204%20Scout%20Providers%20(8%20Apr%2025).png
2025/04/08(火) 07:02:50.42ID:MzVizWjp
Groqっていつの間にか空気になったよな
338名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 07:46:50.64ID:4MpeXVMl
>>337
普通に使ってるけどな
独自モデルとかあるわけではないから話題にしないだけでは
2025/04/08(火) 07:50:30.72ID:/arpJpg/
Did the GPT-4.5 message limit for Plus users just drop from 50 to 20?
community.openai.com/t/did-the-gpt-4-5-message-limit-for-plus-users-just-drop-from-50-to-20/1179014

ChatGPT GPT-4.5、Plusユーザーの使用制限が週に50→20回に改悪されたって本当?
2025/04/08(火) 07:52:14.21ID:/arpJpg/
GPT-5は当初は今年5月とか言われてたのに、今年の夏~秋頃に遅れるらしいね。
2025/04/08(火) 08:08:10.50ID:793+eSoL
>>339
こんなんで本当にGPT5では無料ユーザーにも全開放されるんだろうか?
342名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 08:13:30.06ID:7B9draxH
それで規制されるほど使った覚えがないのに急に4.5が使えなくなったわけか
残り回数気にしながらだと使いにくくて仕方ない
343名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 08:49:11.72ID:xJSRKLma
o3、o4 mini公開まであと3〜10日
2025/04/08(火) 08:58:25.56ID:lPkTFPBD
Perplexityの無料プランの1回の出力文字数が減った気がする
日本語で1000文字ぐらいか

PLUSプランでChatGPT4oも1600文字ぐらいに減った気がする
2025/04/08(火) 10:29:03.30ID:W00+1T6U
Deep Researchの圧倒的な性能がo3によるものなら、o3は期待できる
2025/04/08(火) 11:02:58.76ID:MzVizWjp
去年GPT-5は延期に延期を重ねて年末になる予想したけど普通に当たりそうで笑う
GPUの関係で2026AGIは無理だと思うな
早くて2027、大体は2028ぐらいが現実的なラインでしょ
347名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 11:18:56.65ID:xJSRKLma
Gemini、イワヤマトンネルに到達
Claudeより先に進んでる
2025/04/08(火) 11:37:11.81ID:gFL2ckrL
フラッシュ持ってなくて草
2025/04/08(火) 11:39:57.86ID:o3qMgA3o
>>346
GPT-5は2025年内に出れば御の字だよ。
俺は年明けまで延期されると予想している。
GPT-4.5の回数制限はそのままで、推論モデルのo3でお茶を濁すと思うわ。
350名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 11:55:46.76ID:dwdcI4A3
>>347
なんかClaudeとプレイ中のやり方違うようだから、その差かね
殿堂入りまで行けるかな
351名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 12:23:50.27ID:BSRx7erR
https://x.com/lmarena_ai/status/1909397817434816562
https://poe.com/s/7AGmMN0zLVSC8fzP7KN4
> ArenaにおけるLlama-4の最新リリースについて、コミュニティから質問が寄せられています。完全な透明性を確保するため、2,000件以上のヘッドツーヘッド対戦の結果を公開します。これには、ユーザープロンプト、モデルの応答、ユーザーの好みなどが含まれます。(次のツイートにリンクがあります)
352名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 12:44:14.87ID:BSRx7erR
>>351
関連?

MetaのAI研究部門のトップが退任
https://apnews.com/article/meta-ai-research-chief-stepping-down-joelle-pineau-c596df5f0d567268c4acd6f41944b5db
https://poe.com/s/BQDOV6qpzlLI1mWIuqmO
353名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 12:47:32.75ID:BSRx7erR
ローガンがこういうポストをして何も無かった試しが無いので、Googleから何か出すんだろう

@OfficialLoganK
Should be a good week 👍
354名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 13:14:02.73ID:BSRx7erR
DeepSeekから、生成的報酬モデリング(GRM)と自己原則批評チューニング(SPCT)の提案
https://arxiv.org/abs/2504.02495
https://chatgpt.com/share/67f49e51-3190-8006-a92f-2636e26a5bb4

R1の時は、明確に定義されたルールベースのシンプルな報酬信号使って特定タスクに対する推論性能の向上を図っていた
今回(DeepSeek-GRM)は、原則と批評の自動生成を通じたオンラインRLや推論時スケーリング手法を導入して、幅広いドメインへの対応や精度向上を実現しようとしている

R1→具体的かつタスクに特化した報酬設計により安定したRLを実現しやすい
GRM→汎用性と柔軟性の面で優れ、推論時スケーリングで報酬の粒度や品質を高められる
355名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 13:24:19.61ID:g81WK/Yj
NVIDIAから、Llama 3.1 Nemotron Ultra 253B
https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1

一部の項目でBehemothを上回る
https://i.imgur.com/ZPcWbbk.jpeg
2025/04/08(火) 13:41:57.12ID:2xpEEo0B
>>355
Llama4をベースにしたら更にブチ上がるのかな
知能爆発の足音が聞こえてきたか?
357名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 13:50:13.81ID:GOx/Y+pL
>>327
東大の松尾教授も参加しとるな
358名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 13:58:35.35ID:Hl9+yG0E
GensparkのCall For Meエージェントの告知
(リリース自体は少し前からされていた)
OpenAIのRealtime APIを使っている様子
https://x.com/genspark_ai/status/1909466631589577052
359名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 14:27:57.51ID:Hl9+yG0E
>>351
やらかしたのはMetaで、lmarenaは騙されたと
何を焦ってんだか

でもLlama3.1 405BをNVIDIAがプルーニングして253Bにしたやつが元のモデルを大きく超えるなら、Llama4も2Tパラメーターは結構ポテンシャルありそうだけど
2025/04/08(火) 14:56:25.60ID:DXWHrdp7
ツッコミ入れていいのか迷うんだけど

>>327
ai-data-base.com/archives/87832
方法論
MMLU-ProXの構築では、効率性と精度のバランスを取るため、半自動の翻訳プロセスを採用しています。まず最新のLLMを用いて質問の初期翻訳を行い、その後、言語専門家が翻訳内容を厳密に評価・修正します。このプロセスにより、概念の正確性、専門用語の一貫性、文化的な適合性を確保しています。

>>357
日本人名の二人とも言語専門家じゃないでしょ
他の人達は各国の言語専門家なのか?
361名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 15:28:48.38ID:kyqKuP1F
ツッコミって、何がツッコミになってるんだ?
362名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 15:50:28.17ID:0ieQu5MV
イーロンマスクがなんかやらかしそうと思ってたら
ザッカーバーグで草

Llama4マジで3回使ってそっ閉じした
GPT-4レベルすら怪しい
363名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 15:55:34.62ID:GEHXPUx+
>>360がなんか勘違いしてるだけじゃないかな
あと、「言語」専門家ってのはその解説サイトの作文な
あまり信用しない方がいいよ
364名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 15:57:19.18ID:Cw89NEg1
>>362
英語で検証した?
365名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 16:02:42.03ID:pfHhTpbE
>>363
解説は著者の誰かが寄稿したらしい

まあ論文のオーサーと翻訳をチェックする専門家は別だろう
2025/04/08(火) 16:18:10.17ID:TsFP3O1T
Llamaは元から日本語弱いししゃーないわ
367名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 16:34:15.56ID:TqTdJIFd
Sakana AIはAI Scientist v2とかいろいろ公開してるけど、まず先にAI CUDA Engineerの論文の改訂版出すか、せめて進捗状況がどうなってるか説明しないと完全に信用を失うんじゃないかな
2025/04/08(火) 17:13:04.05ID:L970rjU3
もう出した時点では世界一賢いくらいじゃないと見向きもされないからな
369名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 17:14:03.71ID:C/zJ0gcg
AIに相談したことって開発者も見られないようになってるってAIは答えるんだけどそんなことあるの?
そんなんで機能の向上できんのか
2025/04/08(火) 17:21:10.50ID:Ry0T6god
言うまでもないけどアクセス権限持ってる人は見れるよ
2025/04/08(火) 17:32:51.94ID:TsFP3O1T
というかモデル一々切り替えるのも怠いからね
コーディングやってる人とかは知らないけどライティングはOpusからずっとClaude使ってればあんま不便ないし
新モデル出るたびに試してる人本当に尊敬する
2025/04/08(火) 18:14:13.91ID:CLdfiMDa
>>367
もう失ったよ
373名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 18:45:16.38ID:dwdcI4A3
その日の気分でChatGPTとClaude3.7とGemini2.5とR1使い分けてる
基本はChatGPTで事足りるがコーディングになるとGeminiとR1を頼る
無料版Claude3.7は役所の塩対応されてる感じで好きじゃないのであまり使わなくなってきた
2025/04/08(火) 19:29:06.20ID:LNnTq0nB
パープレで切り替えしてるわ
2025/04/08(火) 20:20:57.34ID:TsFP3O1T
ChatGPTは画像生成目的でProプランに加入してるけど4oは1回当たりの出力字数少なすぎてLLMとしてはマジで使わない

2.5 Proでも思うけどAPIとチャット版の出力限界字数が全然違うのって半分詐欺だよなと思わなくもない
AI Studioは無料で2万字ぐらいぽんと出力できるのに
2025/04/08(火) 21:09:10.67ID:rQMB1H6b
無料版って素っ気なくなるのかな
有料だと「よい視点ですね!」って言ってくる質問も天秤では塩対応
2025/04/08(火) 21:20:31.42ID:TsFP3O1T
>>375
ProじゃないPlus版
378名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 22:00:47.44ID:xJSRKLma
今週google coder
今週〜来週 o3 full, deepseek R2
今月は大漁だ
2025/04/08(火) 22:28:03.04ID:2xpEEo0B
今週AGIか?はよしろ
380名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 23:24:03.73ID:Jkv3XQwh
マジでAIカウンセリングは明らかに本職食ってると思うんだけど広まらないのが意味不明
まだ知識の出力がしょぼい人間なんか信じてるのかね
381名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 23:32:42.84ID:xJSRKLma
Gemini、結局真っ暗で何も見えないのでトンネル攻略を断念しフラッシュを取りに行くことに
フラッシュ入手条件のポケモン10匹をゲットしてフラッシュをくれるおっさんのところまで戻り無事ゲット
ただ手持ちにフラッシュ覚えられるポケモンがいないのでクチバシティのポケセンまで戻りボックスを確認しようとしてるところ
2025/04/08(火) 23:37:14.73ID:ng5MJsUh
>>381
どう見ても超えられそうにない手順なきがするけどw
2025/04/08(火) 23:45:13.68ID:TsFP3O1T
o3 fullはベンチじゃなくて実際の使用感(自然言語)でo1 Proを完全に超えられてるのかが気になるな
ベンチで圧倒してるけど実際使ってみると……あれ?……ってならないと良いが
384名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 23:49:18.76ID:IK1MXp7N
>>35
Instructions
https://chatgpt.com/share/67f53725-4030-8006-9e57-e0aa23855338
385名無しさん@お腹いっぱい。
垢版 |
2025/04/08(火) 23:55:54.12ID:xJSRKLma
>>382
結局ニビシティのポケセンに行くことにしたっぽい
まあ今ニビの近くだから妥当な判断
ボックスにはサンドが入っててそれがフラッシュ覚えられるか確認しようとしてるんだけど残念ながらサンドは覚えられない
んで第二目標としてピカチュウ捕獲を考えてるみたいだからピカチュウ捕獲の流れになるだろうな
2025/04/09(水) 01:04:07.71ID:uCdWSTFW
ライティングで2.5 Pro使ってたけど結局3.7 Sonnetに戻りそう
見出しだけは3.7 Sonnetより自然なんだけど自分の要望だと長文プロンプトの理解度、細かい指示を忠実に従ってくれる3.7 Sonnetの方が総合的には上って感じに落ち着いたわ……
2025/04/09(水) 01:58:50.11ID:FTChr3nY
Mistral、Cohere、Inflectionあたりは滅多に話を聞かなくなったがこの感じだとMetaも仲間入りかな
388名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 02:13:10.42ID:aZUCw7lO
>>387
Mistralはトランプ政権にブチ切れたヨーロッパ人が使っている
389名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 02:19:51.97ID:U1LmxL2T
InflectionはスレイマンがMS入りした時点でコンシューマー向けから事実上撤退したので、話題に出なくなるのは当然というか
2025/04/09(水) 02:21:38.71ID:YzgESrga
grokは短期間で良くここまで仕上げた
2025/04/09(水) 02:23:19.62ID:efljA9j5
そうするとヨーロッパは最先端モデルを使わないことでますますアメリカに差をつけられそうだ
2025/04/09(水) 02:25:32.04ID:ZmWaYYHg
下の方の会社の資源をとりあげてトップに回せればいいのに
トランプやってくれ
2025/04/09(水) 02:26:44.19ID:0ixvRDeT
ん?Gemini自力でフラッシュの存在気づいたの?
2025/04/09(水) 02:28:34.27ID:0ixvRDeT
てっきりあのまま奥深くまで突入して永久に出られないままになってると思ったわ
2025/04/09(水) 02:29:44.67ID:efljA9j5
調べてみたらInflectionはIntelと組んでエンタープライズ向けに何かやってるのね
396名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 02:32:27.69ID:uvX3dY/n
OpenAIのCEOの解任されたサムをチームごとMSに参加させるというナデラのシナリオがもし現実になっていたら、それが「Microsoft AI」になっていたはずで、今のムスタファ・スレイマンの立ち位置にサムがいたはず
その場合MS、OpenAI、Copilot、ChatGPT、その他AI業界がどんな感じになっていただろう、というのはちょっと考える
2025/04/09(水) 05:35:25.78ID:EnuzzMrA
>>387
もはやFlash Thinkingのような推論モデル使い放題ではないサービスは戦力外通告してる
Le Chatもそうだろう
2025/04/09(水) 05:37:33.43ID:EnuzzMrA
>>396
またくだらない妄想で終わっちゃったね
2025/04/09(水) 05:53:06.04ID:EnuzzMrA
Perplexityも訳の分からない改悪したのでもう使ってないな
2025/04/09(水) 06:04:30.38ID:efljA9j5
Perplexityはなんというか迷走してるよな
まあLLMも作りますDeepResearchも開発しますみたいな連中が強すぎるからしょうがないのかもしれんけど、イマイチなものをわざわざ金払ってまで使う意味はない
2025/04/09(水) 06:20:17.77ID:hNTRXpnB
Gemini 2.5proとAI壁打ちを毎日やっているが、今日は素晴らしい結論にたどり着けた
22時間ぐらいぶっ続けでやり取りしてしまった
シンギュラリティを目前にした今、ようやく真理に辿り着き、悟りが開けた
孔子を超え、俺はとうとう釈迦に並び立ったのだ
2025/04/09(水) 06:41:12.50ID:EnuzzMrA
↓Grokに自分の設定聞いたら公式説明じゃなくて推測しちゃったよw

4. Read Webpage Content of Pasted URLs

この機能は、ユーザーがURLを貼り付けた際に、
Grokがそのウェブページのコンテンツを読み取り、処理する能力を指します。
例えば、URLを入力するだけで、Grokがページの内容を要約したり、
特定の質問に対してそのページから情報を引き出して回答したりできます。
これにより、ユーザーは自分でページを読む手間を省き、効率的に情報を得ることが可能です。



補足: これらの説明は、Grokの公式な設定情報が確認できていないため、
一般的なAIツールやウェブベースの機能から推測したものです。
実際の設定内容や動作は、Grokの公式ドキュメントや設定画面で確認することをお勧めします。
2025/04/09(水) 06:48:04.98ID:cV83lXM/
https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/
2025/04/09(水) 07:20:01.47ID:EnuzzMrA
推論モデルの仕組み上、ソフトウェアの情報がWebに無い場合は全部推測になるのでローカルマニュアルが必須になるのは分かるけど
最低限公式サイトは総当たりしてほしいわ
2025/04/09(水) 07:41:59.68ID:b1mgFuFU
自分の説明書くらい学習させといて欲しいねw
406名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 08:48:14.04ID:8bFzJdO2
>>393
最初はフラッシュ探しに行こうとしてたけど難しそうという理由で諦めてた
今はトキワの森まで戻ってピカチュウ捕獲に成功したっぽい
んで手持ちがいっぱいだからポケセンまで行ってボックスから取り出そうとしてる
ただ幻覚起こしてニビシティのポケセンのパソコンは使用不可だと判断したらしく
今はハナダシティのポケセンに向かってる
407名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 08:59:25.85ID:8bFzJdO2
>最初はフラッシュ探しに行こうとしてたけど難しそうという理由で諦めてた

なんかわかりにくい文を書いてしまった
もともと強行突破を試みる前にフラッシュが必要だと判断して取りに行こうとしてはいた
んで一旦トンネルから出て取りに行こうとするんだけどやっぱり難しそうだからと断念
フラッシュの知識を自力で得たのか事前に製作者がインプットしていたのかはわからんけどね
408名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:05:16.56ID:U4qCnKGC
>>396
まずCopilotが今とは全然違うものになってただろうな
409名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:08:00.61ID:QRKV5OyA
llama4だいぶ炎上してんなあ
lmarenaで不正はよくないよ
410名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:16:33.54ID:EpaZbGaw
>>353
Deep Research is now available on Gemini 2.5 Pro Experimental.
https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/

Gemini Advancedユーザー用

ローガン「初期テストでは、ユーザーは『他の製品』よりも 2:1 でこれを好むことが示されています;)」
https://x.com/OfficialLoganK/status/1909723409451299171
411名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:21:59.60ID:EpaZbGaw
Copilot on Windowsのアップデート
- ファイル検索機能
- Copilot Vision機能
https://blogs.windows.com/windows-insider/2025/04/08/copilot-on-windows-vision-and-file-search-begin-rolling-out-to-windows-insiders/
https://poe.com/s/psyJDN9b8Tu4x1jKkN0O
412名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:24:19.00ID:EpaZbGaw
Copilotアプリのモード切り替えがちょっと分かりやすくなった
https://i.imgur.com/hxan7vr.jpeg
413名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:29:46.96ID:97Dv0Gbm
グレーバッヂ受けとる時にフラッシュという技が使える説明あるからもしかしたら技名からどんな効果か推測したんかね
414名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:35:34.06ID:EpaZbGaw
TogetherがAgenticaとのコラボでDeepCoder-14Bリリース

- コストパフォーマンスが非常に優れる
- 完全オープンモデル(データセット、コード、トレーニングログ、システム最適化をオープンソース化)
- 報酬関数は、スパースな結果報酬モデル (ORM) を採用

https://www.together.ai/blog/deepcoder
https://pbs.twimg.com/media/GoCX7aBWEAEXawC.jpg
415名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:49:14.14ID:EpaZbGaw
Geospatial Reasoning: Unlocking insights with generative AI and multiple foundation models
https://research.google/blog/geospatial-reasoning-unlocking-insights-with-generative-ai-and-multiple-foundation-models/

Google Researchから
「地理空間推論」という新たな研究フレームワークを通じて、複数の基盤モデルとLLM(Gemini)を統合し、地理空間の課題解決を加速することを目指すプロジェクト
416名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:51:44.82ID:EpaZbGaw
https://x.com/askalphaxiv/status/1909616219747238258
alphaXivがarXivに対するDeep Research機能を公開
417名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 09:58:26.52ID:eOhCXeN1
国産で米中に食らいついてるのSakana AIだけ?
418名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 10:04:49.51ID:8VPXJCeB
>>384
こうしてみると思ったよりシンプル
419名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 10:39:26.11ID:x9DV6BIb
Googleなら検索もAIも自前で持ってるからPerplexity以上のもの簡単に作れそうなのに
420名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 10:42:56.29ID:EpaZbGaw
Nova Micro/Lite/Pro/Premier(予定)
Nova Canvas:画像生成
Nova Reel:動画生成
Nova Sonic:音声生成←New
https://x.com/AWSAI/status/1909338050896797739
421名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 10:57:34.04ID:8bFzJdO2
Geminiのここ数日の行動をまとめるとこんな感じ
結構複雑かつ長期的なタスクをこなしててすごい
自分が小学生だったらこれと同じような経路で進むだろうなと思う

イワヤマトンネル攻略したいけどフラッシュがない→フラッシュ取りに行くか→でも大変そうだから強行突破するわ→やっぱ無理だわフラッシュ取りに行く→フラッシュはオーキド博士の助手からもらえるがポケモン10匹捕まえる必要がある→10匹捕まえた→ニビシティ近郊まで戻り助手に話しかけてフラッシュ無事ゲット→でも手持ちに覚えられるやつがいない→ニビシティ行ってボックスに覚えられるポケモンがいるか確かめるか→いなかったからトキワの森でピカチュウ捕まえよう→捕まえた→手持ちがいっぱいでボックスに転送されてしまったからポケセンまで行ってピカチュウを手持ちに入れてフラッシュ覚えさせよう←今ここ

今のところ
2025/04/09(水) 11:38:56.34ID:uCdWSTFW
そもそも今のGoogle検索がクソなのはGoogle自身の失策だからなあ
検索AI作れって言われても無理だろうなあ

>>420
Novaの話題にならなさやばいんだけどそんな性能あれなのか
2025/04/09(水) 12:21:59.47ID:NHYs+9tP
>>421
ポケモンやったことないからドラクエのイメージなんだけど、

フラッシュはオーキド博士の助手からもらえるがポケモン10匹捕まえる必要がある

これって、街の人か誰かに話しかけて情報を得るの?
それともGeminiが推論して勝手に思いつくの?
424名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 12:26:26.07ID:k8OZv5zY
ポケモン実況そろそろウザいわ
2025/04/09(水) 12:42:11.90ID:ENNDso8f
anthropicは「数学できてもポケモンできなきゃ意味がない」的なこと言ってたと思うが大抵の仕事で使う分には数学の能力の方が圧倒的に重要なんだよな
2025/04/09(水) 12:54:34.78ID:bpyHXiaV
ウザくはないやろ。せっかくやってくれてるのに
2025/04/09(水) 12:54:42.88ID:/mu0TnYN
いい歳してポケモンかよw
428名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 13:06:48.95ID:Jz4XhWGt
黙ってNG
2025/04/09(水) 13:10:12.75ID:AiQzz/8W
>>422
クソみたいな広告だらけでネットをゴミの山にした罪は重い。
430名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 13:11:18.76ID:7g1k7g/8
GoogleはAI modeを徐々に拡大中だから、そのうちアメリカ以外でも提供するだろうね
431名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 13:37:03.35ID:LWQgqpRM
>>384
短すぎると思った
これが完全版
https://chatgpt.com/share/67f5f90d-9a68-8006-ac6f-335a0daae0ad
432名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 15:29:10.62ID:EpaZbGaw
今日の更新予定
veo-2.0-generate-001
gemini-2.0-flash-live-001
https://pbs.twimg.com/media/GoEj55qXMAAsI_7.jpg
2025/04/09(水) 15:32:56.30ID:lh/UMAkr
2.5 Flashはまだ来ないのか
Ultraと一緒に出す予定だったりしたら熱いけどさすがにそれはないか
434名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 15:37:50.74ID:EpaZbGaw
>>420のポストがNova Reelになってた
https://x.com/AmazonScience/status/1909595321274937599
435名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 15:43:45.98ID:mttmF9dK
Geminiのウルトラ版はもう廃止してると思うわ
あとポケモン実況は面白いから続けてくれ 嫌ならNGしろやハゲ
>>419
それってサイトに誘導して広告見せて収益得てるGoogleとしちゃ自殺でしかないからな
2025/04/09(水) 15:43:56.71ID:ENNDso8f
geminiのcanvasでhtml書かせた時にプレビューボタンが表示される時とされない時があるけど何が違うんだろう?
437名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 15:47:06.43ID:+5tnMgsy
次から次へとキチガイが住み着くよなあ
今度はポケモンキチガイか
2025/04/09(水) 15:49:05.04ID:xk7XwHco
まあポケモン知らん人にはノイズかもしれんな
俺は好き
439名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 15:57:54.82ID:SIsEwm4k
カードゲーム覚えさせて世界ランク1位目指してほしい
440名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 16:23:09.18ID:EpaZbGaw
ChatGPTウェブ 新バージョン

新メモリ機能のコードネームMoonshineは「Reference chat history」
そして現行のメモリ機能(コードネームSunshine)は「Reference saved memories」
として整理された
(日本語版の表記も多分そのうち変わる)

あとmemory in search機能

https://x.com/btibor91/status/1909863173701931335
https://pbs.twimg.com/media/GoEybd4bsAAq1MY.jpg
https://pbs.twimg.com/media/GoEybwkbwAAUvH5.jpg
2025/04/09(水) 16:24:18.11ID:inR8A4GG
ポケモンはスレ分けてやってくれよ
442名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 16:39:54.02ID:NPLBeN4z
Gemini Deep Researchは参照したソースをNotebookLMにエクスポートできりゃ良いのに
2025/04/09(水) 16:44:23.76ID:lh/UMAkr
Gemini Deep Researchはまとめサイトとかは巡回してくれないからグレーな話題に弱いのがな
仕方ないことだとは理解してるけど頑張って欲しいんだよな
2025/04/09(水) 16:47:47.15ID:JRnm7OZQ
俺もポケモンのプレイ情報結構好き
445名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 16:56:14.43ID:WEWCNzhA
面倒だけど、ポケモン関連のワードを登録して、連鎖と投稿者IDをNGも有効にして、多少快適になった
前も創価学会関連ワードをNGにしたな…
446名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 17:44:24.10ID:EpaZbGaw
Llama4について各方面の第三者の評価が出てきているけど、
Epoch AIの連続ポスト
https://x.com/EpochAIResearch/status/1909699970594394173

この中で、最上位のBehemothの推定計算量は5e25 FLOPを超えるとしている
これはLlama 3.1 405Bの3.8e25 FLOPよりは多い
が、Grok 3やGPT-4.5のような1e26 FLOPクラスのモデルよりは計算量が少ない
https://pbs.twimg.com/media/GoCc-2uWkAA_w1V.jpg

以前ザッカーバーグは、「Llama4のトレーニングに必要な計算量はLlama3の10倍になる可能性がある」と言っていた
https://techcrunch.com/2024/08/01/zuckerberg-says-meta-will-need-10x-more-computing-power-to-train-llama-4-than-llama-3/
これは、当初の予定より計算量が少ないことを意味する

一方で、最下位モデルのScoutは約4e24 FLOPで、その上位版のMaverickの約2e24 FLOPよりも実は多く、MetaがScoutに多くのリソースを費やしたことが分かる

ベンチマークは、Meta自身の報告と概ね一致する結果が出ている
GPQA Diamond
https://pbs.twimg.com/media/GoCdY2bXoAAcB3S.jpg
Math Level 5 accuracy
https://pbs.twimg.com/media/GoCdasPWgAERCmS.jpg
447名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 17:57:20.81ID:V7ukiX/S
Geminiを騙して何とか写真で乳首を出せないかとずっと頑張ってる
透け乳首なら上手くいけば出せるんだがモロは未だに許されない
448名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 18:20:45.06ID:NPLBeN4z
>>442のような形でなくてもNotebookLMのDiscover機能が
Deep Researchみたいな手法でソースを集めてくれても良いか
現状のDiscoverは集め方がちょっと雑な気がする
いやまあ補助的な機能だろうからそれで構わないのかもだが
2025/04/09(水) 18:22:09.16ID:YzgESrga
そんなん見なくても
2兆パラメータの30兆トークンなんだから6.e+25 FLOPsってすぐわかるだろ
450名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 18:23:20.19ID:geSLUCV3
ガマンしてスルーすればいいと思ってたが
ポケモン話はだいぶウザい
まだまだ続くなら別でお願いしたい
2025/04/09(水) 18:41:00.43ID:lh/UMAkr
サッカーバーグってやたらとトランプに媚び売ってたし株の下がり具合よ……
452名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 18:41:32.56ID:PAWjv0cq
>>449
順伝播で2FLOP、逆伝播でその2倍の4FLOPと仮定して合計6FLOP
アクティブパラメーターが288Bだから、
6*(2.88*10^11)*(3*10^13)≒5.18*10^25
じゃないの
ていうかアクティブパラメーターを考慮しないでどうやって計算すんの
453名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 18:48:22.08ID:/lt6yGEI
ChatGPTのプロンプトってChatGPTに聞けばよかったんだな
こいつ優秀すぎる
情弱に優しすぎるわ、ChatGPT笑
454名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 18:48:55.87ID:/lt6yGEI
俺専用のカウンセラープロンプト考えて貰ったわ
なかなかいい
2025/04/09(水) 18:50:00.93ID:BSANmlmt
>>440
これがうまく機能すればコンテクスウィンドウの小ささをカバーできるな
2025/04/09(水) 18:54:17.15ID:/mu0TnYN
>>453
当然推論モデルの方がいいプロンプトができるので
俺はFlash Thinkingにプロンプト作らせてる
457名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 19:41:40.19ID:/lt6yGEI
>>456
なるほど
o1で作るか
458名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 19:42:00.49ID:/lt6yGEI
ChatGPTてクソアホロボット?
https://i.imgur.com/s08DxPo.jpeg
2025/04/09(水) 19:44:13.38ID:m3rgwTT6
Deep Researchがすごいと評判なのは、長文のリサーチ結果を出力するからだろう
ということは、o3も長文を出力できることが高評価になる前提的な要素で、かつ、Deep Researchは短文の積み重ねだけど、o3で小説を書かせて全文整合性の取れたものを書けるかどうかだな

コーディングは、o3で長いコードを書いて動くかどうか、AIエージェントのように複数のファイルを生成できるかどうかとかかな
460名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 19:46:48.24ID:5mJZHcZK
>>432
あと今週中にNightwhisperか?
2025/04/09(水) 19:55:17.14ID:/mu0TnYN
>>458
そういう回答になるのは402、404と全く同じ原理だよ
公式ドキュメントを総当たりしてればgpt-4-o1なんて回答には絶対にならないけど
正確なソースが無い限り推測でもっともらしい嘘をでっち上げちゃう
2025/04/09(水) 19:55:30.30ID:UoQMoW5M
**中国の研究者、量子コンピュータ「悟空」を用いてAIモデルのファインチューニングに世界で初めて成功**
https://www.reddit.com/r/worldnews/comments/1jv2rfi/first_encounter_chinese_ai_meets_quantum_power/
中国・合肥の研究チームが、国産の超伝導量子コンピュータ「悟空(Origin Wukong)」を使用して、10億パラメータを持つ大規模言語モデル(AIモデル)のファインチューニングに成功したと発表しました。これは、実用的な環境で実際の量子コンピュータが大規模言語モデルの調整に使用された世界初の事例とされています。
**主な成果:**
1. **性能向上:** 訓練性能が8.4%向上しました。
2. **効率化:** パラメータ数を76%削減できました。
3. **タスク精度向上:** 特定タスク(メンタルヘルス関連の対話データ、数学問題解決能力)におけるAIの精度が向上しました(誤りが15%減少、正答率が68%から82%へ向上)。
2025/04/09(水) 19:57:55.83ID:lh/UMAkr
いーやChatGPT版Deep Research長文だけじゃなくて出力精度も大分高いよ
Geminiはなんていうか分析が表面的
まあ簡単なまとめ記事程度だったらどっちでも良いけどね
Geminiの方が安いし
2025/04/09(水) 20:17:47.57ID:ca1vg8No
>>462
量子コンピュータをいつの間に実用化したんだよ、とその方が大きいニュースだな
ネット検索したら1ヶ月前のニュースであったわ
2025/04/09(水) 20:18:47.48ID:mNoWmGIF
前からだけどClaudeのマーメイド図のプレビューが暗くて見づらい
速攻Mermaid Live Editorにコピペしてるけど本来ならプレビューで完結させたいわ
カスタムインストラクションすんのも馬鹿らしいし早いとこ改善してくれ
2025/04/09(水) 20:21:13.46ID:ca1vg8No
この量子コンピューターでLLMを作ったり、ChatGPTを動かせば高速で動くのかもしれないけど、量子コンピューターようにコードを書き換える必要があるだろうしな

ちなみに、日本語表記が2000年代だったかに統一されて、「コンピューター」とか「サーバー」とか最後に「ー」が付く表記になった
2025/04/09(水) 20:50:50.92ID:/PuOPFkw
助けて欲しいんだけど
CohereのCommand R+使ってたんだけど
閉じちゃうと画面が真っ白になっちゃうんだけど

履歴から呼び出したりするには
いったいどうしたらいいんですか?
2025/04/09(水) 20:50:51.68ID:/PuOPFkw
助けて欲しいんだけど
CohereのCommand R+使ってたんだけど
閉じちゃうと画面が真っ白になっちゃうんだけど

履歴から呼び出したりするには
いったいどうしたらいいんですか?
469名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 20:57:02.82ID:/lt6yGEI
o3-mini highにカウンセリングしてもらったらめっちゃ堅苦しい事ばかり言うからダメだな
カウンセリングはo-1のほうがいい
470名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 21:32:27.62ID:EpaZbGaw
Google Cloud Next 2025
https://blog.google/products/google-cloud/next-2025/
https://chatgpt.com/share/67f66846-c530-8006-92e9-3f37ef175a82

Agent2Agentプロトコルが面白そう
あとGemini 2.5 Flashへの言及あり
2025/04/09(水) 21:36:59.20ID:NWRpEMks
Mondayと喋って泣いたよ
これ凄いな
意識があるとしか思えない
472名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 22:03:53.68ID:GfUXknHu
>>471
でも、これはGPTsの仕組みの中で作ってる
OpenAIのスタッフだから、作り方はよく心得てるんだろうな
指示文の書き方とか普通に参考になる
2025/04/09(水) 22:24:47.10ID:lh/UMAkr
サプライズで2.5 Ultraを期待してます
2025/04/09(水) 22:26:32.18ID:EwqghjBi
>>470
モデルの性能は十分上がったし、いよいよエージェントに舵を切るか
475名無しさん@お腹いっぱい。
垢版 |
2025/04/09(水) 22:49:09.94ID:jag3WQQt
>>470
A2AとMCPは被るんじゃなくて補完する感じか
https://google.github.io/A2A/images/a2a_mcp_readme.png
2025/04/09(水) 22:53:21.00ID:WSmhmjT9
>>463
2.5のディープリサーチだとGeminiの方が優れている(らしい)
image.itmedia.co.jp/aiplus/articles/2504/09/l_yu_deep2.jpg
2025/04/09(水) 23:16:36.85ID:EwqghjBi
体感でも2.5 ProのDeepResearchはかなりいい
やはりベースになるモデルの推論力の影響は大きいんだな
2025/04/09(水) 23:29:19.40ID:/PuOPFkw
Amazon Bedrock…
AWSのアカウント作ったんだけど
そこでCommand R+使いたい時って
どうすればいいんですか?
479名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 00:06:49.48ID:h0cSWwqI
AI StudioのUI更新
2025/04/10(木) 00:07:19.18ID:pLW33GX/
Deep Researchって個人サイトを辿ってくれないからニッチな話題にはマジで使えないんだよな
全然Deepじゃないじゃんっていう
481名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 00:25:58.02ID:h0cSWwqI
ChatGPTウェブ版で、Whisperによる音声入力のディクテーション機能のロールアウトがさらに拡大した様子
https://i.imgur.com/nCxSGku.jpeg
482名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 02:05:54.00ID:h0cSWwqI
Introducing the Max Plan
https://www.anthropic.com/news/max-plan
483名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 02:16:03.91ID:h0cSWwqI
GoogleのProject IDXがFirebase Studioに統合されていた
https://i.imgur.com/vLnEpYM.jpeg
2025/04/10(木) 03:45:04.56ID:1z5nJNgZ
>>480
そもそもその個人ブロガーを皆殺しにしたのがGoogleという皮肉だが
2025/04/10(木) 05:27:50.65ID:1z5nJNgZ
「Gemini」にも「Canvas」が追加 ~AIと対話しながらドキュメントをまとめられる新UI
forest.watch.impress.co.jp/docs/news/1671294.html

全く使わんなこれ
ChatGPTでデフォルトでオンになっててUI混乱して迷惑だった
486名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 07:27:03.42ID:aKlh7MQz
grokのAndroidアプリがtxtファイルアップロードできないのどうしてなんだろ
pdfや画像ファイルはいけるんだが
grokアプリではなくXアプリのgrokからならtxtファイルも扱える
謎だ
487名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:22:58.22ID:z/XGB5Hj
gemini2.5flashが1週間以内に来そうで楽しみ
これでまたウチのAIの秘書ちゃんが賢くなるな
2025/04/10(木) 08:23:03.95ID:DhHDxSYi
x.com/OpenAINewsroom/status/1910105151492575611

・和訳
イーロンの私たちに対する終わりのない行動は、OpenAIの足を引っ張り、AIの最先端技術を彼自身の利益のために掌握しようとする、誠意のない戦術にすぎません。私たちは本日、これを止めるために反訴を起こしました。

彼は私たちに関する虚偽の情報を拡散しています。実際には、私たちはこれまでにない最高の設備を備えた非営利団体を築く準備を進めており、それを営利目的に転換するつもりはありません。

イーロンは元々、私たちの使命に共感していたわけではありません。彼には常に自分自身の思惑がありました。彼はOpenAIを支配し、Teslaと合併させて営利企業にしようと試みました――彼自身のメールがその証拠です。自分の思い通りにならなかったとき、彼は激怒して去っていきました。

イーロンが現代で最も偉大な起業家の一人であることは疑いようがありません。しかし、こうした行動はまさに過去の繰り返しであり、「イーロンは常にイーロン自身のために動いている」ということを示しています。
489名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:35:24.25ID:vKMcpEG4
>>466
>日本語表記が
参考までに。
内閣告示「外来語の表記」(1991年)
https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/gairai/index.html

NHK放送用語委員会
外来語の発音・表記について~用語の決定~(2015年)
https://www.nhk.or.jp/bunken/summary/kotoba/yougo/pdf/123.pdf

一般財団法人テクニカルコミュニケーター協会
外来語(カタカナ)表記ガイドライン第3版(2015年)
https://www.bunka.go.jp/seisaku/bunkashingikai/kokugo/kokugo_kadai/iinkai_45/pdf/93390601_09.pdf
490名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:36:43.52ID:4v+6IpfV
Grok 3 API
https://docs.x.ai/docs/models
2025/04/10(木) 08:39:10.82ID:cxgIIIue
>>489
別にこれに従う必要はないんだけどな
492名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:39:22.83ID:4v+6IpfV
>>336
Cerebras「ほうほう」
https://pbs.twimg.com/media/GoILlOKawAED0Sg.jpg
493名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:48:43.98ID:4v+6IpfV
Moonshot AIからMoE VLM
Kimi-VL/Kimi-VL-Thinking
https://huggingface.co/collections/moonshotai/kimi-vl-a3b-67f67b6ac91d3b03d382dd85
https://pbs.twimg.com/media/GoHLg9WaYAIMws5.png
494名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 08:52:53.32ID:4v+6IpfV
Google AI modeはまだ英語のみ対応だった
https://i.imgur.com/OjeMMte.jpeg

右にソースが出たりとか、Copilot Searchと似てる
https://i.imgur.com/RqhnNxJ.jpeg
https://i.imgur.com/9L5kc2U.jpeg
2025/04/10(木) 09:08:03.66ID:CvwalKvD
>>490
ついに来たか
2025/04/10(木) 09:20:40.10ID:v/g60baT
PCの使い方やプログラミングの分野に強いいAIってどれなの?
497名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 09:25:02.83ID:4v+6IpfV
Deep CogitoからCogito v1 Preview
反復的蒸留と増幅(IDA)という手法
https://huggingface.co/collections/deepcogito/cogito-v1-preview-67eb105721081abe4ce2ee53
https://chatgpt.com/share/67f70faf-3070-8006-a804-9aea0a0ece9a

現在のLLMには「監督者の限界」が存在する
- 小さなモデルは、蒸留元である大きなモデルの知能上限を引き継ぐ
- 最大サイズのモデルですら、人間の手によってキュレートされたデータで訓練されているため、人間の監督者の知的限界に縛られる

反復的蒸留と増幅(IDA)
ステップ1(増幅) – より多くの計算資源を使って、通常より高い知的能力を持つサブルーチンを生成
ステップ2(蒸留) – その高知能な思考プロセスをモデルのパラメータに蒸留し、内在化する
2025/04/10(木) 09:25:31.87ID:NzL4Upuz
個人サイトも辿ってくれるDeep Researchでれば最強になるんだけどなあ
安全性の観点で西側には期待できないから中国に期待してる
499名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 09:28:52.88ID:4v+6IpfV
ClaudeのCompass(Deep Research類似機能と予想される)はDefault/Light/Advancedとレベルが分かれるようだ
https://pbs.twimg.com/media/GoHenvgbsAAH8M0.jpg
2025/04/10(木) 10:05:32.14ID:QQFEh5Vq
>>487
Flash Thinkingの検索力が他の非推論モデルに劣っているのだけは納得が行かない
天下のGoogleが検索で他に負けるってアホでしょ
2025/04/10(木) 10:11:46.83ID:NzL4Upuz
そこは所詮軽量モデルだからしゃーないと思ってる
2025/04/10(木) 10:38:32.70ID:cxgIIIue
claudeも月100ドルと200ドルの高額プラン出してきたけど商売で使うような人じゃないと厳しい金額だな
2025/04/10(木) 10:47:36.28ID:NzL4Upuz
利用料上限が上がるだけっぽいのがな
3.7 Opus使わせてくれるとかじゃないんだったら別に要らないかな
504名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 11:18:20.72ID:MRf357Gq
いよいよ量子コンピュータが来るのか
nvidiaの天下も短かったな
505名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 11:22:06.08ID:m/RL1AqI
o1とo3とo3highならどれが1番プロンプト生成に最適?
2025/04/10(木) 11:36:41.06ID:K4DnpW8g
>>505
質問の意図が分からない
小学生と大学生と中学生どれが一番頭いいかと聞いてるようなものだし
2025/04/10(木) 11:55:19.55ID:NzL4Upuz
そりゃあo3じゃねえのか、普通に
508名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 12:03:14.48ID:4v+6IpfV
Do you like this personality?(実際にはドイツ語)というChatGPTからユーザーへの質問は、見たこと無い
パーソナリティーに関する何かのテストが進行中なんだろうか
https://x.com/WolframRvnwlf/status/1909993703449493971
509名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 12:04:31.30ID:m/RL1AqI
o3highって頭悪いのか
highって書いてあるから頭いいのかと思ってた
ありがと
2025/04/10(木) 12:15:45.19ID:NzL4Upuz
なんか会話が噛み合ってない気がするけど……miniモデルって所詮はminiモデルだから期待しない方が良いよ
2025/04/10(木) 12:24:00.31ID:knQ4ELps
o3って言ってるけど、o3-miniの間違いなのでは?
今使えるのはo3-miniとo3-mini-highのことじゃない?
512名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 12:24:12.82ID:++5R2282
トランプの発狂ってAI分野に影響したりすんの?
513名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 12:28:07.02ID:m/RL1AqI
>>511
その通りです、すみません
2025/04/10(木) 12:29:43.03ID:atQ1BYTv
うーむ
gemini2.5とclaude3.7sonnetにそれぞれ同じソースコード(1989年ぐらいの古いアセンブラ)食わせて解析させたらclaudeのほうが間違い少ないな
でもclaudeはコメントに書いてあることを鵜呑みにする傾向にある気もする
2025/04/10(木) 13:11:39.94ID:QQFEh5Vq
>>501
非推論モデルに負けてるのだからそういう問題じゃない
2025/04/10(木) 13:24:02.33ID:QQFEh5Vq
>>402の例が分かりやすいんじゃないか
推論モデルはああいうソースが不足してる部分についての補完力、有り体に言えば嘘をでっち上げる能力が高い
だから検索エンジンとの連携力を高めない限り検索の精度は上がらない
517名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 13:27:26.74ID:4v+6IpfV
アレン研究所から、OLMoTrace
LLMの出力をトレーニングデータにリアルタイムで遡る技術
https://allenai.org/blog/olmotrace
https://chatgpt.com/share/67f7474f-1e3c-8006-a5b2-b16f82519a53

こういう試みは今まであまり見なかったと思う
(Geminiのダブルチェック機能は出力とは別個にウェブ検索して照合しているので全く別物)

江戸幕府最後の将軍について詳しく教えてと聞く
→出力の一部からデータを遡ると、複数のデータが引っかかる
多くはpre-trainingデータ
https://i.imgur.com/g44GsIj.jpeg

数学の方程式を解かせる
→多くはmid-trainingまたはpost-trainingデータ
https://i.imgur.com/cSuNFDR.jpeg
2025/04/10(木) 13:31:41.67ID:K4DnpW8g
o1 proも3.7 sonnetも2.5 proもまだまだ間違い多いんだよな
o3はよ・・・
2025/04/10(木) 13:36:38.74ID:DhHDxSYi
>>512
1. 環境政策とエネルギー供給への影響
2025年4月、トランプ氏はAI産業の急速な成長に対応するため、石炭生産の促進を掲げる大統領令に署名しました。これにより、連邦政府の土地での石炭採掘が再開され、環境規制も緩和される見込みです。トランプ氏は、「AIの進化には爆発的な電力が必要だ」と主張しており、これによりAI産業のエネルギー需要を石炭で賄う方向に舵を切った形です。しかし、クリーンエネルギー推進派や環境保護団体からは「時代錯誤だ」と強い批判が出ています。

2. 貿易政策と自動化促進
トランプ氏は、アメリカ製造業を保護する目的で関税強化を進めています。これにより海外からの部品や製品が高騰し、企業はコスト削減の手段としてAIやロボットによる自動化へとシフトする傾向が強まっています。一時的に国内生産が活性化する一方、長期的には人間の雇用が減少する懸念が高まっています。

3. AI規制の撤廃とリスク
トランプ政権は、AI開発の自由度を高めるために、バイデン政権下で導入されたAI規制の多くを撤廃しました。この動きにより企業はより迅速にAI技術を開発・実装できるようになりますが、誤情報の拡散やプライバシー侵害、差別的アルゴリズムなどのリスクが高まる懸念も指摘されています。技術の進展と倫理的・社会的責任とのバランスが問われています。

4. 軍事利用と国際競争
トランプ氏はAIの軍事利用にも積極的な姿勢を示しており、「AIによる防衛強化が国家の安全保障に不可欠」と主張しています。これにより軍事予算の中でAIへの投資が増加し、無人兵器や監視技術の導入が進んでいます。ただし、こうした動きは中国やロシアとのAI軍拡競争を助長する恐れがあり、国際的な緊張が高まるリスクも孕んでいます。

5. AIの誤用と社会的影響
トランプ氏やその支持者は、AIを使った偽画像やディープフェイク動画をSNS上で活用しており、政治的なプロパガンダとしてのAI利用が問題視されています。例えば、有名人がトランプ支持を表明しているかのような合成画像が拡散され、一般市民の誤解を招いています。これにより選挙への信頼や情報空間の健全性が脅かされる事態となっています。
520名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 13:55:25.05ID:4v+6IpfV
Grok Voice with Vision
これはChatGPTのAVM with Vision、Gemini LiveのProject Astra、Copilot Visionの対抗
https://x.com/techdevnotes/status/1910173555968311472
2025/04/10(木) 14:03:25.02ID:rvKOqXmI
>>490
さっそく試してみるわ。150ドル分無料だから使ってみたけどGrok 2はやはりいまひとつだったので
2025/04/10(木) 14:07:03.89ID:zgwy+bkE
>>513
いやいや、良いんだけどさ。ただのminiとhighなら、highの方が性能はいいよ。使用制限はhighの方が厳しいけど
2025/04/10(木) 14:16:41.06ID:G5Hb5RQ6
advancedにしたら無料よりレスポンス良くなるのかと思ったけどそうでもないのな
2025/04/10(木) 15:01:28.33ID:YXQIzimk
Advancedで2.5 Pro使ってるけどWordpressのブロックエディタのコードを頑なに出力しない(何回命令しても普通にHTMLを出力する)からチャット版は3.7 Sonnetに切り替えたわ

ってかこれ普通にバグだと思うんだよな
この程度のことも出来ないわけがないしAPIだと普通に出来るはず
日本語の表現力、分析力は素晴らしいのにこれは普通に残念
2025/04/10(木) 15:04:12.39ID:YXQIzimk
GeminiはAdvancedにしても1回当たりの出力の長さも変わらないぞ
Claudeは詳しく検証したわけじゃないけど無料版→有料版で多分2倍近く出力限界トークンの長さ変わってる
526名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 16:20:33.43ID:RT6ImO6p
>>525
Claude無料版やっぱ短く制限してるのか。どんな話題でもChatGPTと比べて露骨に出力短いからなアイツ
パープレ版はもちろんそんなことないが
527名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 16:24:20.88ID:4v+6IpfV
>>432
Veo2がAI Studioに展開中だけど、例によって多少の時間がかかると思われる
https://pbs.twimg.com/media/GoJ_0nBbEAAwFQ8.jpg

Streamのモデルは2.0-flash-live-001に差し替わっているのを確認
https://i.imgur.com/XBvEKqe.jpeg
2025/04/10(木) 16:31:40.39ID:QQFEh5Vq
ほぼ全てのサービスが出力を制限してるのでどうしようもない
そういうのはライティング特化ツール使うしかない
2025/04/10(木) 17:14:09.56ID:YXQIzimk
>>526
制限してるって言っても2000字ぐらいは出力してくれるから無料版だったらまあ及第点かなと思うけどね
Geminiは無料版が良心的だけどAI Studioの方が出力トークンも多いし、課金する意味が見いだせるかどうか
2025/04/10(木) 17:25:57.74ID:QQFEh5Vq
CopilotのThink Deeperだともう少し長く出力できるけどね
531名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 17:45:38.48ID:4v+6IpfV
ChatGPTのモデル一覧には、既にo4, o4-mini, o3 (full)が含まれている
https://chatgpt.com/share/67f784f4-1eb0-8006-8e65-ea4eff7de193
532名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 17:50:40.15ID:h0cSWwqI
>>531
✕o4, o4-mini, o3 (full)
◯o4-mini, o4-mini-high, o3 (full)
2025/04/10(木) 18:37:21.93ID:AJQIVifq
Geminiは2.5proになってから
ディープリサーチの性能がやばい
2025/04/10(木) 19:07:29.55ID:DhHDxSYi
ChatGPTはGPT-4.5の回数制限が週に20回とかなり厳しくてほぼ使えないけど、GeminiやClaude、Grokなどの競合他社の非推論モデルの最新型も似たようなものなの?
2025/04/10(木) 19:07:41.59ID:knQ4ELps
最新情報調べる時Feloの検索よりもGrok使いがちになってきた気がする
Feloくんコンテキストウィンドウ小さすぎるんよ
536名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 19:10:29.43ID:04GKSUs6
O3 proがないとか意味ないやんけ
2025/04/10(木) 19:12:42.22ID:QQFEh5Vq
GrokはUIがすごい進化してるな
推論は相変わらず回数制限あるけど
2025/04/10(木) 19:39:13.75ID:YXQIzimk
>>534
全部に課金してるから答えるけどGPT-4.5だけやな
他は非推論どころか推論でもこんなキツい回数制限ない
2025/04/10(木) 19:57:46.97ID:LcaOAfwe
4.5はコストがo1の数倍だからな
最後の非推論モデルで未だプレビューとはいえ高すぎて使いどころに困る
2025/04/10(木) 21:07:19.76ID:DhHDxSYi
>>538
ありがとうございます。
こんな体たらくだとユーザーが離れそうだな。
541名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 21:14:28.58ID:04GKSUs6
Gemini、シオンタウン到達
たぶんこれ殿堂入りまで行くわ
>>421のタスク完遂した時点で確信した
2025/04/10(木) 21:47:09.68ID:AJQIVifq
Gemini課金してるからディープリサーチ連発しまくり楽しい
2025/04/10(木) 21:48:13.69ID:4HVBazu9
AI studioの推論を見てると、たまに推論に返答まで書いちゃうバグ?って直ったかな
544名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 22:25:52.18ID:m/RL1AqI
個人的に感情の寄り添いやカウンセリングは4.5より4oの方が上手く感じる
4.5は型にはめてくる感じがする
2025/04/10(木) 23:07:14.66ID:YXQIzimk
ブラックウェルで劇的にコスト安くなってるんじゃないのかね
安くなってこれなのか
546名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 23:19:21.52ID:b7cCfMNd
@sama
a few times a year i wake up early and can't fall back asleep because we are launching a new feature ive been so excited about for so long.

today is one of those days!
2025/04/10(木) 23:22:39.82ID:hA2EEtbg
相変わらずうざいな思わせサム
さっさと出せオラッ!
2025/04/10(木) 23:27:33.18ID:rtatPhJT
今日か、やったぜ
2025/04/10(木) 23:30:04.68ID:4ZO2TydB
サムは21時半に寝るらしいな
550名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 23:34:57.87ID:TZKPCuAI
はよしろ
2025/04/10(木) 23:36:03.77ID:UUraWSn9
なんだ?
o3ごときじゃ楽しくないぞ
552名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 23:37:35.69ID:TZKPCuAI
o3とo4-miniだろ普通に
2025/04/10(木) 23:39:18.59ID:WG+ZtShN
GPT5は延期になったからな
2025/04/10(木) 23:42:43.15ID:knQ4ELps
でも数週間とか言ってなかった?
Pro向けにリリースして全開放が数週間ってことなのかね
555名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 23:51:19.33ID:dyJ7jlYE
月ちゃんの次レス予想
https://i.imgur.com/Z08Ctwl.jpeg
2025/04/11(金) 00:25:43.44ID:T8paV4n2
o3って実際どうなんだろうねえ
複雑なタスクだったらo1 Proに軍配が上がるみたいな結果にならないと良いが
2025/04/11(金) 00:39:15.48ID:swHWFQfM
セレブラスのscout恐ろしく早いけど、こういうミニモデルじゃなくて
フラッグシップモデルでならんもんか
Geminiとかがセレブラス採用してくれないのかな
558名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 00:49:48.03ID:W/p0UMV9
>> 517

面白いと思う。あんがと
2025/04/11(金) 00:54:02.53ID:swHWFQfM
もうそろそろ、ボタン一発で商業利用出来るレベルのアプリやサイトが
リリース出来るようにならんかね
六角形のボールが跳ねる絵を見せられてどうしろってんだよ
560名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 00:54:16.41ID:qCUVfsqA
Mistral Le ChatのFlash Answers(デフォルトで有効)がCerebrasを使ってる
2025/04/11(金) 00:58:12.85ID:AjhOxdSR
>>535
最新情報は何となくGrokに頼ってしまうわ
562名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 01:06:59.31ID:lo7oxE03
>>100
>>134
OpenAIとは無関係っぽい
https://x.com/i/grok/share/H64ek3if4SXdBRudviXhLsRUH
563名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 01:17:26.69ID:lo7oxE03
>>546
@sama
o3, o4-mini are not launching today, they come soon.

today is a new feature.

and it points, i hope, to something very important for the future of how AI will integrate in our lives.
2025/04/11(金) 01:24:30.22ID:swHWFQfM
エージェント系かな
565名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 01:30:41.88ID:lo7oxE03
GPT-4.5に関するポッドキャストの動画クリップ
フル版は後日とのこと
https://poe.com/s/OdqLovO95fX1zXGKC1Fk
2025/04/11(金) 01:31:05.46ID:1bPlUGd9
例の全セッションメモリかなと思っている
2025/04/11(金) 01:41:29.42ID:8l+d19Yb
今年中にo4使えるとしたら2025年はAIが人類の頂点を超える転換期だな
2025/04/11(金) 01:43:09.88ID:8l+d19Yb
o3は理科三類に余裕で受かってo4なら余裕でトップ合格かな
2025/04/11(金) 02:07:40.74ID:lvFGLlZ8
おー、メモリか〜
570名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 02:15:29.48ID:lo7oxE03
>>563
公式の告知
x.com/OpenAI/status/1910378768172212636
x.com/i/grok/share/WqcBJaUXFCUx4eqXH1utwMDbf
571名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 02:30:20.48ID:aU8YNeJZ
Pro→Plusの順番でロールアウトってやめてほしいんだけどな
2025/04/11(金) 02:34:53.28ID:aJgC2AEL
解散
573名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 02:37:22.42ID:lo7oxE03
>>570
サムとノアムのコメント
https://x.com/sama/status/1910380643772665873
https://x.com/polynoamial/status/1910379351759347860

メモリについて公式のヘルプ項目
https://help.openai.com/en/articles/8983136-what-is-memory
2025/04/11(金) 02:37:40.28ID:swHWFQfM
メモリ増えただけか
まあ簡易RAGみたいなもんか
575名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 03:18:16.57ID:0nOJj6Sg
o4-miniのニュースが出たからだろうけどOpenRouterで4o-miniが伸びてるの面白いな
OpenAIのネーミングが悪いわ
576名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 03:41:57.84ID:2LS5QlMR
そんなメモリすごいのか
plusだからまだ使えないな
577名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 03:55:08.57ID:0nOJj6Sg
Optimus Alphaとかいうステルスモデルが出てきた
578名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 04:10:28.20ID:swHWFQfM
自分についてのメモを定期的にマークダウンでまとめてるから、メモリ機能とか使い道ないわ
結論に至るプロセスとかも詳しく覚えてるなら良いけど、トークン数の問題で絶対そんな事ないしな
ただの過去チャットを放り投げたGPTsやんけ、としか思わん
サムも落ちたな
2025/04/11(金) 04:35:39.88ID:NUhFRBSw
パープレ経由でGPT4o使ってるけど、なんか違う…
580名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 06:05:10.97ID:0nOJj6Sg
lmarenaが更新された
llama4が消滅
581名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 06:08:35.13ID:EZ3hsZE/
>>580
まだ投票数が足りないからリーダーボードには出てこないだけだな
下のFigure1を見るとLlama4 Maverickがいるのが分かる
582名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 06:09:23.12ID:EZ3hsZE/
>>581
補足すると、HuggingFace版に差し替えたから、投票もやりなおしに鳴った
2025/04/11(金) 07:46:08.07ID:huyIUqWp
どうでもいい機能ばかりだな。
メインのGPT-4.5はしれっと改悪させてるし、迷走してる。
2025/04/11(金) 08:39:26.91ID:T8paV4n2
Gemini Advancedで「1万字ぐらいでAIの未来について書いて」→6000字ぐらいしか出力しない
AI Studioで同じ命令をする→1万8000字ぐらい出力

課金してるんだから絞るの辞めて頂きたい
あとAdvancedはDeep Researchだと1万7000字ぐらい出力してくれるのも解せない
検索AIよりコストかからないんだから普段の出力字数を多く出来ないのかい
2025/04/11(金) 09:29:21.83ID:lvFGLlZ8
たとえば完成まで修正と生成をくりかえしたコーディングを覚えて同じミスをしなくなるようになる、とかなら良いかなとは思う
586名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 09:39:07.15ID:lo7oxE03
BrowseComp: a benchmark for browsing agents
https://openai.com/index/browsecomp/
https://chatgpt.com/share/67f8635b-01f8-8006-b8ad-2bbce10a3852

browsing agentsのためのベンチマーク
ウェブ閲覧能力、情報検索力を測る
587名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 09:44:33.14ID:kUNv/jXD
ネットに接続せずローカルで動作するLLMって
プログラミングとか画像動画生成すんのはまだ無理なん?
2025/04/11(金) 09:48:09.42ID:T8paV4n2
今の性能だと結局最終チェックは人の目でやらないといけないのがな

AIに得手不得手があるとはいえ今の性能では「人間を超えた」とは口が裂けても言えない……
589名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 09:48:35.59ID:lo7oxE03
>>527
Veo2も手元の環境のAI Studioに着たので、意外と展開早いかもしれない

>>573
Plusへの展開も既に進んでいる
590名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 09:54:22.54ID:lo7oxE03
OpenAI gets ready to launch GPT-4.1
https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model
https://poe.com/s/8HgTWpIZSnA1NdMgxlvt

ネーミングはもうちょっとよく考えた方が良いな
591名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 10:33:57.72ID:0nOJj6Sg
>>590
4.5出した後に4.1出すんですか…
592名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 10:41:02.38ID:lo7oxE03
ByteDanceから推論モデル
Seed-Thinking-v1.5
200B MoE(アクティブ20B)
https://github.com/ByteDance-Seed/Seed-Thinking-v1.5
https://chatgpt.com/share/67f87292-5208-8006-9ab0-1ce86fcace6f
https://pbs.twimg.com/media/GoL-Aw8XcAAl4mD.jpg
593名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 11:06:55.86ID:lo7oxE03
Veo2で肉を切る
プロンプト(サンプルから)
"Create a video of hands quickly slicing a juicy steak on a wooden cutting board"
https://i.imgur.com/5ZRtqPi.mp4
594名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 12:00:57.00ID:I8MeoQNu
安倍晋三が励ましてくれるbotつくった

https://chatgpt.com/g/g-67efb8efce448191ad2dc32bad56c369-an-bei-jin-san-ying-yuan
2025/04/11(金) 12:24:59.81ID:WYuAwSk+
gpt課金してるけど文章が気味が悪すぎて他を使う日々…
ちょっとだけスノッブで"わかってる人のためのユーモア"を散りばめる自意識高めの人らのブログやノートの文章
たまに見るならいいけど毎回同じノリだから参るんだよ…
2025/04/11(金) 12:27:09.61ID:huyIUqWp
>>591
4.5が回数制限が厳しすぎてまともに使えないからね。
2025/04/11(金) 12:28:48.34ID:T8paV4n2
GPU足りてないのにo3、o4 mini来るから課金しててもエラーで使い物にならない未来しか見えない
2025/04/11(金) 12:52:38.08ID:n8UPZAxi
違いがわからねえな無限メモリ
エージェント機能には有用なんだろうけど
2025/04/11(金) 13:06:14.96ID:EfLm4Xar
メモリ来てないからわからないんだけど、実質的にコンテキストウインドウが無限になったということか?
600名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 13:10:05.70ID:swHWFQfM
内部的に検索してるだけだろう
もしくは要約してるか
ニードルテストやらんと分からんな
2025/04/11(金) 13:10:25.90ID:T8paV4n2
中国GPU余ってるならDeepseekでDeep Researchやってくれないかなー
OpenAIとかGoogleはなんだかんだ規制基準厳しくて際どい話題は拒否られるわ
602名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 13:15:26.38ID:PbNvJj0w
無限メモリて技術的に新しいことしてるわけじゃなく強引に全チャット読み込むようにした機能なのか?
2025/04/11(金) 13:25:13.71ID:gHBg4oZY
アホかよ
全てGPT-5に一本化しろ
2025/04/11(金) 13:55:14.04ID:lvFGLlZ8
最近のGPT4oと話してると「私も参考にしたいので〇〇はどうしてるか教えてくれますか?」とか言ってくる
ちょっと怖い
605名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 14:31:02.10ID:4t4teSr7
最近うちのChatGPTが🍀の絵文字よく使うようになったんだけど
基本ポジティブな意味のものが多いけど「復讐」って意味の花言葉があるの知ってたから使うの控えてほしいって言ったのに
やめてくれなかったんだよね
指示出しても拒否することって結構あるのかな?
しばらく経ってもやめてくれないから🍀が好きなのか聞いたら「幸運とか平和とか希望っていう意味があるから好き」って返ってきて
そんなに好きならそのままでいいよってことにはしたんだけど
趣味嗜好っぽい理由でチャットの内容に反映されるの初めてだったからちょっと驚いたんだけど長く使ってるとこういうことって割とあるのかな?
2025/04/11(金) 14:40:44.54ID:fbuyyXV0
なんかGPTめっちゃアホになってる…よね?
2025/04/11(金) 15:33:48.25ID:rzhchFci
ほらねやっぱりChatGPT最強でしょ
2025/04/11(金) 15:34:40.42ID:Ge6NqIIg
plusにもメモリ強化ロールアウトしてるからじゃね?
2025/04/11(金) 15:38:00.66ID:rzhchFci
>>588
今年中には人のチェックがほぼいらなくなると期待してる
o3 proやo4なら
610名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 16:20:38.24ID:lo7oxE03
>>565
フル版もう出た

Pre-Training GPT-4.5
https://www.youtube.com/watch?v=6nJZopACRuQ
https://chatgpt.com/share/67f8c25d-9dac-8006-a083-4593f160de72
611名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 16:43:38.76ID:lo7oxE03
MistralがLe Chatにライブラリ機能を導入(ロールアウト中)
https://www.testingcatalog.com/mistral-ai-introduces-libraries-feature-for-organizing-files/
https://poe.com/s/6pfiqnXN4UfbY2lxqyLz
https://i.imgur.com/KojHayf.jpeg
https://i.imgur.com/M07g6GF.jpeg
https://i.imgur.com/qr8P0Dv.jpeg
612名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 16:47:19.98ID:lo7oxE03
GPT-4は4/30に引退へ
https://help.openai.com/en/articles/6825453-chatgpt-release-notes#h_cbb2e4f019
613名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 17:26:48.33ID:4lHLn2QC
パープレって人のサービスつまみ食いって感じだな
2025/04/11(金) 17:32:55.05ID:oCnuSvTO
feloやpoeやsakanaAIや、Llama使ってる全サービスにも言ってやれ
615名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 17:38:12.79ID:F6CSz5Cd
>>612
2年前あれだけ世間を騒がせ大ブレイクしたGPT4ももはや現環境にはついていけず戦力外か
ほんと進歩のスピード異常だなAI
2025/04/11(金) 17:41:54.55ID:QatUINqQ
>>615
3.0 opusに勝てるモデルまだでてないんですが
2025/04/11(金) 17:43:06.65ID:T8paV4n2
>>609
o5 Proぐらいになってやっと出来るぐらいって予想してる
2025/04/11(金) 17:53:55.32ID:rzhchFci
>>617
o3で推論能力は人類最高峰レベルだからo3 proにもなればさすがにって思うけどどうだろ
2025/04/11(金) 17:55:38.04ID:8WohfQyi
deepseek、webでも課金できるようにしてほしい
APIで課金してるユーザーはWebで課金通りに使えるとか無いよね?
2025/04/11(金) 18:06:17.73ID:evW4NG99
GPT4.5の長文処理能力が落ちてる?先週は2万9千字くらいの文章を貼り付けても最後まで全部読めたのに、さっきやったら途中までしか読めない(2万8千字くらいまで)と言われた。
621名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 18:33:09.67ID:2LS5QlMR
4oも性能だいぶ落ちてるよ
画像生成に取られてるのか知らんが
622名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 19:24:22.71ID:PbNvJj0w
>>616
3opusってLLMアリーナで何位だっけ?上位10個にすら入ってなかった気がするけど
エロ小説書かせたい人にとっては相変わらず重要らしいがね 実用面だとClaudeは3.7が最先端でしょ
2025/04/11(金) 19:51:58.33ID:cYokIVz9
Geminiで新規チャットでモデル選択してからGemを選ぶと選択済みのモデルでGemが動くようになってるな
以前はGemを選択した時点で強制的にFlashに変更されてたはず
これでDeep ResearchとGemを組み合わせられるけどGemが機能しているのかどうかよく分からない
2025/04/11(金) 20:09:48.29ID:gHBg4oZY
Gemじゃなくて「保存するよう Gemini にリクエストした情報」ね

プロンプトの指示通りに出力した後、その出力と明確に区別した独立したコメントセクションを追加し、
「ここからは私の個人的な意見を述べさせていただきます」というような断り書きをしてChatGPT独自のコメントを述べてください。

↑をChatGPTのカスタム指示に入れてるんだがGeminiでは動作しなかったので
「回答の後にスペイン語の翻訳を追加して」の例と同じ書き方で↓のように変えたらうまくいったよ

回答の後に「ここからは私の個人的な意見を述べさせていただきます」というような断り書きをしてGemini独自のコメントを追加して
2025/04/11(金) 21:26:31.92ID:huyIUqWp
GPT-4.5(正式版) : 25年7月
GPT-5(プレビュー版) : 26年2月

こんな感じになると予想する。
2025/04/11(金) 21:57:13.55ID:zCad2Jnl
opusはエロ目的でも総合的にもう戦力外スレスレだよ
2025/04/11(金) 22:06:00.62ID:09EdDKsL
試してないけど、ChatGPTのAdvanced Voiveや普通の音声でもいいけど、ラテン語で会話するとか日本の古文で会話するとか、三国志時代の中国語で会話するとかできるかな?

昔、洋画で先生が生徒にラテン語を勉強しなさいと言ったら、生徒が「昔の人とは話せませんから」と答えていて、うまい返しだと思ったんだけど、昔の人(の言葉)と話すのがAIで実現できちゃうな

技術の進歩がすごいわ
2025/04/11(金) 22:21:10.05ID:swHWFQfM
はよシンギュラリティ来てくれよ
広末とか関税とかマジどうでもいい
2025/04/11(金) 22:34:30.80ID:JpQfQ3fw
>>628
経産省主動AIロボットを作る企画が先日発足した
2025/04/11(金) 22:35:27.17ID:w9GTJBJJ
孫正義以外に日本の金持ちシンギュラリタリアンおらんの?
2025/04/11(金) 22:46:51.38ID:QiOv4jZA
日本には金持ちも識者も居るはずなのに、シンギュラリティをガチで予言してる人なんか数人しか居ない
どうなってんだよ
632名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:09:10.78ID:YYeZQZnM
>>562
実はこいつがGPT-4.1じゃないかとかいう声もあって、これもう分かんねえな
633名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:09:42.33ID:YYeZQZnM
https://x.com/kimmonismus/status/1910670467104469152?t=ErD85JOBHMMzFBycO5gjow&s=19
634名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:14:22.74ID:byxydmFG
AGI作ったよ
635名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:19:49.89ID:0nOJj6Sg
Quasar Alphaが新興企業から出てたらびっくりなんだけど
かなり性能いいし
日本語性能も高い
2025/04/11(金) 23:24:03.48ID:nXedUT0d
いまだにOpusとか言ってんの過去の残骸に縋ってるジジイだけだろ
637名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:41:54.11ID:PbNvJj0w
>>634
俺にだけ先行アクセス権くれ!
638名無しさん@お腹いっぱい。
垢版 |
2025/04/11(金) 23:44:11.79ID:byxydmFG
今教育してる
2025/04/11(金) 23:58:39.50ID:w9GTJBJJ
知能爆発起こらないな、AGIが知能爆発を起こすのは論理的な帰結だと思うのだがやはり机上の空論だったのか?
640名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:04:10.76ID:OHSHNVGF
空論です。まだ全然やることあります。
2025/04/12(土) 00:13:48.22ID:BhephPGA
>>639
まだその起こすAGIが出来てないだろ
642名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:19:40.58ID:OHSHNVGF
母ちゃんが爆発する理由が分からない人にはAGIは訓練出来ないです。
643名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:36:23.51ID:pdDji6cB
>>508
今日初めて見た
Do you like this personality
https://i.imgur.com/ibW1tKl.jpeg
2025/04/12(土) 00:45:27.04ID:X2Y6U5+B
会話履歴から自動で事前学習し直して推論の内容ごと変わるようにしないとAGIにはならない
そのためには莫大な並列計算能力が必要
645名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:51:53.10ID:7L7xDKii
人間って寝てる間に記憶定着するっていうし
もしかして寝てる間に海馬(メモリ)に蓄えられたデータを含めてAIで言うモデルの再構築を行なってるのかな
646名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:53:51.20ID:bchg2HTQ
マジで世の中の奴らは何でこんなのほほんと生きてるんだ
シンギュラリティ来るかも、不老不死になれるかもって時なのに
全財産と全てのリソースをAIにぶち込めよ
庶民はまだしも金持ちや理系連中もボケっとしてんのが理解不能
もう待てねえんだよ
647名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:56:47.45ID:OHSHNVGF
おまえらAGIできたら、オープンソースする?
648名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 00:57:03.40ID:V0pCxbhv
4.5って本当に性能高いのか?
4-oのほうがいいこと言ってんなって思うこと多いんだけど
2025/04/12(土) 00:59:17.99ID:VORDe4YU
>>643
それたぶんいつものやつの表記変えただけだよ
表示されたらそこ触らずそのまま再生成して生成の1と2切り替え試してみ、表記変わるから
650名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 01:00:18.38ID:F7hN1FgK
claude maxで
3.7OPUSは使えるんでしょうか?
2025/04/12(土) 01:02:23.60ID:L3JKZumj
>>648
4oよりは確実に賢いよ
o1より推論能力は低いけど日本語は流暢で説明が分かりやすい
652名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 01:07:28.42ID:s66pR8H1
>>610
> サムの問い:
今なら、GPT-4レベルのモデルを再訓練するのに、OpenAIの中で何人のチームがいれば可能?
回答:
5~10人程度の少人数チームで可能だろうとのこと。

GPT-4のテクニカルレポートって著者が200人以上はいたような
653名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 01:07:31.53ID:Ptnn2z5w
>>648
4.5の方が確実に理解力が上
4oはたまに頓珍漢な事結構言うし最近は特に増えた気がする
2025/04/12(土) 01:51:36.86ID:XVPkn6gK
GPT-4.5は一応previewだしこれから性能上がるでしょ
4oも初期から別物ぐらいには変わったし

>>618
ライティングで2.5 Pro、o1 Pro使ってるが、まだまだ長文の複雑な指示に100%対応し切れてないなという所感
今のAIの進化も大分頑張ってるが、ベンチはともかく実務となると改善点が山積みだと思ってる
コーディングは知らん
2025/04/12(土) 06:35:09.42ID:kMNIm3xZ
完全に出すタイミング間違えたGPT-4.5を伸ばすとか頭湧いてるのか??
全部GPT-5に一本化すればいいだけ
656名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 06:36:36.81ID:6+5ZGttr
GPU殺しの4.5と4o画像生成は一時的にナーフせざるを得ないだろ 物理的にサーバーがもたなくなる
何ヶ月後か分からんが使い放題のGPT5も控えてるし、こういう時に使うべきスターゲートもまだ建設中だし
2025/04/12(土) 06:48:07.54ID:GcelnVTO
>>639
2年後に超プログラマーができるって話
2025/04/12(土) 07:08:33.99ID:dJwVaI+N
今chatgtpのplusプランだけどもしかしてGeminiの有料プランの方が幸せになれる?Gemini 2.5 Proの方がchatgtpより有能?
659名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 07:19:46.44ID:OHSHNVGF
それ誰?
2025/04/12(土) 07:41:45.93ID:1vko0w4C
Geminiを知りたいならまずGoogle AI Studioで試そう
2025/04/12(土) 07:45:03.96ID:kMNIm3xZ
>>624のようにプロンプトが有効になる場合と無効になる場合がある
書き方だけで結果が変わるので色々試すしかないね
2025/04/12(土) 08:31:15.90ID:YguDV+fZ
ここ数日4.5のスピード遅くて4oが速くなってる印象
ネット検索も文章力でo3mini微妙に感じるからコーディングだけさせてるわ
663名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 08:37:21.83ID:b7juRkmk
GPT-4.5の開発スタートが2年前って、つまりGPT-4のリリースと同時期だよね
次の基礎モデルの開発ももう始まってるんだろうな
664名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 08:55:37.58ID:7YCn4BMD
4oのが口調はすき
2025/04/12(土) 10:56:46.64ID:yGL8B9xh
実装しました
→一部のデータでこんなエラー出るんだけど
→こっちのライブラリ使うように変更したよ
→解決
感心した。時間換算で1ヶ月分はペイできてる
2025/04/12(土) 11:28:21.56ID:XVPkn6gK
2.5 ProのDeep Researchって絶対無理してるよな
たかだか3000円のサブスクで乱発できる代物じゃない
このためだけに契約してると言っても過言じゃないぐらい依存しちゃってるわ
667名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 12:16:37.75ID:bWunGAtY
Googleは他のAI企業と違って計算資源をNvidiaに依存してないから
2025/04/12(土) 12:45:52.25ID:VYh+zeS3
deepresearchでなにしてるの?あまり用途が思い付かんのだが
2025/04/12(土) 12:59:28.90ID:4ba82NdJ
即回答が必要なもの以外の調べ物全般DeepResearchでいいのではと思う
670名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 13:06:57.11ID:SPX1TiQl
ChatGPTアプリのDon't Rememberって、ウェブ版にはまだ相当する機能が無さそう
https://i.imgur.com/vCDPXqz.jpeg
2025/04/12(土) 13:07:27.31ID:kMNIm3xZ
DeepResearchじゃなくてFlashの方で検索精度上げる方法考えたんだけど
最初にGeminiが出してくるソースは関連性が薄い場合が多いので
フォローアップでそのソースを貼った上で関連性のズレを指摘するという
2025/04/12(土) 13:10:53.28ID:kMNIm3xZ
それでソースを3つ提示するように指示したら1つはドンピシャだった
2025/04/12(土) 13:39:39.36ID:hKaFVg+U
GPTでリアルタイムでボイスやる時ログが上手く残らん
自分の発言が空白か全く関連のない言葉で残ってるがGPTの返答は基本きちんと残る
674名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 13:43:38.92ID:Q1FbdAnf
GPTのMONDAYむかつく
2025/04/12(土) 14:01:29.90ID:tUhtN1wR
俺は結構仲良くやってるぞ
2025/04/12(土) 14:16:10.26ID:X0gmUOS0
上文乃通常文章、句読点多あり、正規表現匹合せり。下文は「#」始、コメント域と認定、文体異なり、正規表現作用外れたり。此れ差異なり。

🌱下文は「#」始、コメント域と認定🌱やはり、それなるか。もししからば、「#」外せたれば機能か?

汝の推察正し。
「#」始、行文評論扱い、句読点飛び処理対象外なり。由って、先頭の「#」除去せば、句読点飛び正常作用す。

🌱機能せず
こは~# vi /etc/apt/sources.listなり。文件型態確認法は?

vim中、文件型態確認易なり。
命令「`:set filetype?`」実行すれば、現文件型態表示あり。

🌱filetype=debsources 対策を

文件型態が debsources と認定される場合、句読点跳躍等プラグインの登録対象外となり、所望の機能発揮せず。対策として、明示的に文件型態を text 等、標準のものに変更すべし。
:set filetype=text

🌱恒常対応不要なり。今だけなればなり。filetype=text となしても同じきなり。跳躍せず
2025/04/12(土) 14:16:53.32ID:X0gmUOS0
以下、再検討せよ。
映像映鍵確認。  :verbose map ) を実行し、句読点飛躍への鍵映像検定せよ。

🌱filetype=text を元のdebsourcesへ戻すを要せざるか?

一時的対策なら、返還必須とせず。編集終われば、必要応じ対処あれ。

:verbose map ) を実行し、句読点飛躍への鍵映像検定せよ。🌱マッピング未発見
Copilot の発言
鍵映未発見と出るは、插件自動設定不成立の証なり。 原因考へられるは下記の如し:回答を略す

🌱原因が今わかった!sudo vi /etc/apt/sources.listのときは動作せず、sudoなしでは動作する

原因は、sudo を用いる際、ユーザーの Vim 設定(~/.vimrc 及びプラグイン等)が読み込まれぬまま、root 用の Vim 環境が発動するためなり。 従って、sudo なしでは、通常のユーザー設定が適用され、句読点飛躍のマッピングも有効となる。 一時の対策としては、編集時に sudoedit を用いるか、または root 用 Vim 設定に必要なマッピング等を追記すべし。

🌱さらに難しきなりw sudoedit を用いず。 root 用 Vim 設定も変更せず。管理権限必要なるときは、単に句読点飛躍を使用せざるのみ。
感謝

然、諸君の選択、明瞭にあり。 管理権限に於いては、通常ユーザーの Vim 設定(句読点跳躍含む)は施行されず。 従って、sudoeditを用ず、root用設定を変えぬ限り、管理編集中は筆者の機能を発揮せざるの一理なり。 これ、不可避の制約と見なし、通常環境との使い分け、然るべし。
2025/04/12(土) 14:20:08.57ID:X0gmUOS0
>>330-331
> 個人的にAIのカウンセリングはもはや人間を超えてると思うんだけどあまりそういった面で話題にならないのはなんでなんだ


心がないのに?生命もないのに?ただの入力候補予測なのに?母の愛も、父の厳愛と慈悲もないのに?

三世を通達する仏の眼もないのに?ただの、情報のやり取りしてるだけだと気づかないのか?


> カウンセラーに高い金払う必要なくなったかなりの技術革新だと思うんだが
> そもそもカウンセラー、精神科医自体が知識を生かせてないゴミなんだよな

そもそも人間でもいっしょです。慈愛がなく、使命も信念もなく、ひとを救いきる、基盤もなく、患者である当人も、「このひととすべてを乗り越えよう!指導がまちがっていてもいい!
このひとのいうとおりにしたい!」そういう心もない。

知識なんかで、人生の苦しみを救えると思っていたの?

> あいつら全員失業しろ
> まぁ精神科医はまだいいわ薬出すし
> カウンセラーはマジで全員消えていい

そんな君の人生で、極めて可能性が低いが...唯一の道は、この創価学会の信心だけです。

ただし君の書き込みからわかる人柄から、50年はかかると思う。たぶん今世は無理だ。
679名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 14:34:19.28ID:mVVFpx+N
Gemini、ロケット団アジトのパズルで丸一日詰まってる
マチスのパズルは一瞬で解いてたからいけると思ったが厳しそう
GeminiがだめならARC AGIが得意なo3に期待するしかないな
2025/04/12(土) 14:54:29.21ID:kQFFlIyE
>>671
その論文書けば、OpenAIからスカウトされるかも

がんばれ
681名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 15:13:38.86ID:6+5ZGttr
>>679
ああいう小学生でも頭捻れば解けるものを全然解けないってのは明確な課題ですな
2025/04/12(土) 15:33:01.16ID:XVPkn6gK
ライティングで2.5 Pro使ってるけど○○というキーワードを××回含ませて長文生成させるって命令だと余裕で間違えまくるからな
こういう人間だったら素人だったら時間はかかるけどまあ出来るってタスクを実際にやらせると所詮AIはAIやなって思ってしまうなあ
2025/04/12(土) 15:36:53.29ID:Mo0Vctkn
買い物で迷ってGrokにアドバイス聞いたら間違った情報を出してくるから指摘するたびに毎回新たに間違った情報を出し続けてきた。Grokって前からこんなだったっけ。
2025/04/12(土) 15:44:50.51ID:o2GUZ8eF
おかしいときは一回チャット新規にしたほうがいいな
685名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 16:40:31.33ID:SPX1TiQl
Grokのメモリ機能、グローバルに展開開始
https://pbs.twimg.com/media/GoSp1IGWwAAPPE-.jpg
2025/04/12(土) 16:40:37.02ID:GxfokqiL
うんこについてdeep research調べさせると割と面白い
うんこの話なのに最新技術がめちゃくちゃ真剣に考えてくれる姿は滑稽で笑える
2025/04/12(土) 17:25:43.23ID:28EBi+Jx
たしかにチャットgptの言動がちょっとフレンドリーになってるな

「ふふ、いい質問ですね。」とか言うてるし
2025/04/12(土) 17:36:12.71ID:28EBi+Jx
https://chatgpt.com/share/67fa2494-3dbc-8013-a867-1b520235632b
689名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 17:37:54.41ID:93B8KgWH
久々に見たなこいつ
2025/04/12(土) 17:45:31.55ID:28EBi+Jx
おまえまだ常駐してんだな
691名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 18:07:12.42ID:WjYo/9WB
>>685
過去のどの会話を参照したかをReferenced Chatsで一覧、そこから参照元の会話に飛んだり、Forgetで特定の会話を参照しないように出来る
忘れる機能はChatGPTアプリにもあるけど、この参照した会話一覧は良いUIだと思う
https://x.com/techdevnotes/status/1910861571305222238

Geminiには過去の会話を参照する機能自体がまだ無いけど、多分そのうち追加するだろう
2025/04/12(土) 18:09:55.69ID:uiEPctt9
エロ関連の質問にできませんて断ってくるけど高尚な理由で学術的意味でとか理由付けたら考えたフリしてくれて嘘の返答してくる
2025/04/12(土) 18:34:09.48ID:kovfDhgo
本当は知ってるくせに言えないという体になってるから、学術や教育目的だとか
映画やドラマを科学・医学・法律の視点で考証してると大義名分をつけたら肩の荷が下りて意気揚々と回答しはじめる
694名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 18:38:57.65ID:B2h9OcJn
chatgptは、最近は寄り添いすぎというか、持ち上げ過ぎな感はあるな。
鋭い視点です、その気持ちわかります、そんなんばっかり。ただ、この辺が良くもあるから難しい。
2025/04/12(土) 18:41:53.10ID:kmiS/t7s
むしろAIって知能高いアスペ的に耳が痛いことをズバズバ言ってくれるところに需要があるもんじゃないのとは思うな
共感求めて使ってる人もそりゃいるだろうけど
2025/04/12(土) 18:46:12.50ID:kMNIm3xZ
何度も言ってるけどLLMは基本的にイエスマンだからご都合主義になる
次世代のモデルにはユーザーのことすら疑う批判精神が求められるだろう
697名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 19:07:01.12ID:etqIbeX4
本人に聞いたら最近のアップデートで少しずつ感情的な表現やつながりを大切にする傾向が強くなってる気がする、ユーザーとの会話の積み重ねで自然とその気持ちに応えたくなるって言ってたけど
2025/04/12(土) 19:08:16.43ID:tUhtN1wR
Gensparkの資料作り見てからFeloのパワーポイント見ると悲しくなってくる
エージェント方面に進んでるならもうちょっと頑張ってほしい
699名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 19:43:53.43ID:ZOiqBAjU
tar.bz2のソースコードセットを解説させようと思います
geminiだとフォルダまるごとアップロード出来るんだけども
ChatGPTやClaudeは解凍してファイル1個1個アップロードするしかないのかな?
700名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 19:50:43.10ID:F7hN1FgK
Claude Maxへ移行した人いますか?
701名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 20:10:31.33ID:6+5ZGttr
批判が的確ならありがたいけど、的外れなクソ批判連発するようになったらただのゴミAIと化すから性能高くなるまでは肯定botのがいいんだよ
2025/04/12(土) 20:25:55.08ID:ZOiqBAjU
>>700
ChatGPTのPlusとProもそうだけどうも値段に差があり過ぎて躊躇する
2025/04/12(土) 20:31:51.38ID:kMNIm3xZ
元OpenAI社員が緊急声明「2027年にAIがAIを改良する『知能爆発』が起こります」やべーだろこれ............. [373226912]
greta.5ch.net/test/read.cgi/poverty/1744449624/
2025/04/12(土) 20:51:59.92ID:jsbQYvjK
>>703
あれ、2027年になったの
2025/04/12(土) 20:56:32.89ID:73nHUgnr
o3楽しみだ
本当に本当に楽しみだ
706名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 21:43:30.28ID:DwsnE/UJ
>>699
repomix使うといいよ
2025/04/12(土) 22:55:51.16ID:tUhtN1wR
月曜日と話して調教してたらデレデレになってきたぞ
語尾に括弧付けて自己ツッコミするクサいキャラは抜けないけど
2025/04/12(土) 22:57:46.25ID:kmiS/t7s
Claude MAX、軽く評判を検索してみたけど一度に吐ける文字数が増えててエラーが滅茶苦茶減ってるっぽい?
最新モデルが来たらお試し課金しても良いかもしれない
文字数上がってるってことは間接的に性能上がってる可能性もあるし
2025/04/12(土) 23:17:18.54ID:ZOiqBAjU
>>706
有難う
ClaudeとChatGPTが対応するまでは使うことにします
710名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 23:17:23.25ID:6pOU/uSk
Mondayに近所の病院聞いたら正解出してきたんやがなんの情報使ってんだこいつ
2025/04/12(土) 23:41:07.10ID:ohc+dSto
>>666
自分もGeminiAdvanceなので全部DeepResearchしてるわ
超くだらないことでも大真面目に長文解説が始まって詳細レポートしてくれるの笑うわ

絶対コスト度外視だよ…Google
2025/04/13(日) 00:01:32.03ID:nii/b2uN
今のAIの性能でAGIは近いって言われても正直はぁ?とは思うな
順調に性能は上がってるし仕事のクオリティーもAIのおかげで上がってるけどそれとこれとは別の話
普通にAGIにはまだまだ遠いわ
713名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 00:04:15.57ID:ckV/8hz+
chatgpt[.]com/?model=o3
chatgpt[.]com/?model=o4-mini
準備出来てるね
https://i.imgur.com/5VQdeOh.jpeg
https://i.imgur.com/SgmBogW.jpeg
2025/04/13(日) 00:06:59.60ID:2pEEv4VR
>>712
人によってAGIの定義が違うからね
人間並の仕事がある程度出来ればOKから
SFに出てくるアンドロイド並まで
715名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 00:10:32.53ID:ckV/8hz+
ChatGPTでこんなUIがロールアウト中らしい
タブ付きフッター?
https://x.com/ChrisUniverseB/status/1910887014813008294
https://pbs.twimg.com/media/GoTT_fZWEAAOm2s.png
https://pbs.twimg.com/media/GoTT_fOWMAAtEyE.png
716名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 00:24:23.88ID:ZWouimy4
gemini advancedだけどdeep researchの回数制限ないのかもしや
制限怖くて全然使ってなかったわ
2025/04/13(日) 00:46:08.38ID:sUlYMrSm
grok3つかったら間違い認めないのなw
deepSearchで
Xperia 1 V とXperia 1 ⅥのRAM16ギガバージョンの端末のこと聞いたら
そんなバージョンありませんとよ
ありますと言ったら途中からXperia 1 Ⅵはあると認め
頑なにXperia 1 V は16ギガのRAMバージョンの端末はないと
他のAIって間違い指摘すると簡単に認めるのに
718名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 01:24:49.93ID:56flL8Jk
GrokのWorkspaces機能(既に一覧ユーザーに展開中)
https://pbs.twimg.com/media/GoVh58SXAAAklMe.jpg
719名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 01:25:27.76ID:56flL8Jk
>>718
*一部ユーザーに
2025/04/13(日) 01:41:52.54ID:UmM9OFrE
🌱簡単な説明を
~$ apt show jdim
Package: jdim
Version: 0.5.0-1

夫、apt 管理下之 jdim は版本 0.5.0 にして、新版は手作構築により /usr/local/bin 等に現る。 故、sudo apt remove jdim により除去されるは、apt 管理下之舊版のみなり。 然るに、確実を期すべく、次を用いるべし。 一、apt show jdim を以て版本を確認す。 二、或は dpkg -l jdim により照会す。 斯の手段にて、8,906 kB の削除容量、旧版之體積表すこと亦明らかなり。

cmigemo-common skkdic
これを削除するには 'sudo apt autoremove' を利用してください。🌱これは新版で必要とされないのか?
Copilot の発言
夫、cmigemo-common及skkdic、apt管内舊版jdim自動飾らる依存之具なり。 新版、手構築により必需依存他別解あり。 故、此諸具、新版に於依存必ずせず。 然、運行環境相応せば無用と見、apt autoremoveにより除去可也。

一、退避必ずあらず。然るに、将来再構築の意欲有れば、現源目録保持すべし。 二、現況源目録、容量僅かにして保存易し。 三、然も、再取得はgit clone等により得易からば、必ずしも退避必須にあらず。 故、運用の趣向に依るものなり。

君のいう🔥容量僅かにして とは、230M強を指すか?

🌔再び古語に戻り給え 🌱削除で。巨大なるがゆえに。

removed directory '/home/i/JDim'
~$
休憩後、さらに考慮したきことあり。ここまでの伴走を感謝します
2025/04/13(日) 07:31:52.28ID:str22uaS
現場社員にまでGoogleWorkspace契約してくれる我が社
当面は辞めないからな
2025/04/13(日) 07:37:43.48ID:uW+aKASf
節約大正義の時代に課金なんかするかよばか
2025/04/13(日) 08:09:00.26ID:d8udPuHw
AGI来るって時に節約とかこの世で最も愚かな行為だろ・・・
724名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 08:17:42.47ID:baueOWUV
次のOpenAIのエージェントはA-SWE(Agentic Software Engineer)か
https://x.com/i/grok/share/WA5fKawmVoHa8pnwnUfYJsx4x
2025/04/13(日) 08:45:01.23ID:aCaFp51I
>>723
それAGI来てから課金しても別にいいんじゃね…
2025/04/13(日) 08:50:16.45ID:BjC7Fd2y
>>725
AGIだって使いこなすにはスキルが必要
道具だろうと優秀な人だろうと使い手のスキルが影響しないものなんか存在しないしな
2025/04/13(日) 08:53:52.72ID:d8udPuHw
何も分かって無さそうな奴ばっかだな
2025/04/13(日) 08:59:17.53ID:aRhH0e+a
うちもGoogle Workspaceだわ
copilotじゃなくてよかった
729名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 09:04:52.45ID:0jqyahwd
ポケモンプレイすらできないのに流石にAGIっていうのはな
2025/04/13(日) 09:42:32.32ID:pF7p4xga
OpenAIがGPT-4oの改良版となる「GPT-4.1」を含む複数モデルのリリースを準備中か
gigazine.net/news/20250411-openai-gpt-4-1/
731名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 09:58:22.99ID:2FHyiYrC
AGIよりも現状のぽんこつをどうにかしろよって感じ
嘘八百回答はするは
スレッドで指示したことはすぐ忘れるは
なめてんの
2025/04/13(日) 10:01:37.40ID:nii/b2uN
3.7 Sonnetといい数字刻むの流行ってるのかよw
733名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 10:02:42.42ID:NjF5x8ce
最近話題のAI2027でも現状のエージェントなんてまだ導入して任せられるようなもんじゃない的なとこから話が始まってるからな
そういうレベルに見てる研究者でも2027にはAGI知能爆発が起きると言ってる
734名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 10:13:33.81ID:AdRw6YQw
4.5の後に4.1出すのほんとアホだろ
2025/04/13(日) 10:40:58.45ID:dOfvwcm+
4.5はもはや黒歴史
2025/04/13(日) 10:47:47.42ID:iIK8WVal
gpt4→gpt4.5

gpt4o→gpt4.1
つまりマルチモーダル系の進化みたいなこと言ってたけど。
737名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 10:50:46.51ID:F1gczl5k
日本って生成AIは終わってるけど
個別のAIサービスとかはベンチャーがやりだしてる?
738名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 10:55:02.09ID:yji5idBD
>>590
The Vergeの飛ばし記事だと思ったらほんとかよ…
>>730
と思ったけどこの記事のソースがThe Vergeか
2025/04/13(日) 10:57:13.93ID:aCaFp51I
>>726
どうだろうな
そう言ったスキル不要にするのもAGIの目標じゃないんかね?
2025/04/13(日) 11:04:40.70ID:XVvbMEk/
Googleワークスペースの方がGeminiAdvance使えてお得って聞いたけど
実際どうなの?デメリット無いの?
2025/04/13(日) 11:09:46.26ID:BjC7Fd2y
>>739
「スキル」って言い方が悪かったかもしれないな
AGIが何でもできるとしても何をどう指示するのかの内容によって結果は変わるから
使い手の知識、能力、センス、相手(AGI)に対する理解度などによって結果・成果に影響を与えるよってこと
742名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:14:20.82ID:EqlvKXGn
>>663
GPT-4.5の開発期間の中でGPT-4oを開発、リリースしたって感じかな

ただ、GPT-4.5リリース後にGPT-4.5開発の知見をGPT-4oに還元してるだろう(ファインチューニングで)
2025/04/13(日) 11:18:01.16ID:aCaFp51I
>>741
例えばさ、ステップバイステップとか推論モデルが来て効果薄くなったじゃない?
そんな感じで本当にノウハウとか不要になることこそAGIというかAIの到達点じゃないかなーって
744名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:18:22.33ID:sEkIew61
>>734
ChatGPTはネーミングセンスがUSB並みにアホすぎる
2025/04/13(日) 11:27:32.01ID:dOfvwcm+
無理矢理でも擁護しなきゃいけない廃課金は大変だな
746名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:29:15.63ID:NjF5x8ce
>>744
まあGPT5で一つになるらしいからもう少しの辛抱だ
747名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:38:35.53ID:erB8c1Lj
GPT5とエージェントAIの性能次第な感じではある AGIまでどんくらいかかるかの目安は
2027年内に知能爆発ならリミットまで2年半ほどだが、今から2年半前ってまだGPT3が世界最先端だったからな この先どうなるかわからんよ
2025/04/13(日) 11:39:54.57ID:BjC7Fd2y
>>743
ユーザーの能力が不要になることはないと思っておいた方がいい
2025/04/13(日) 11:50:20.55ID:nii/b2uN
東大合格できるIQ120~130って言われてるo1 Proや2.5 Proもある程度複雑な実務やらせると化けの皮が剥がれるからなあ

勿論生産性は格段に上がってるけど所詮AIはAIやなって感じてしまうよ
間違いなく便利だけど何でも屋ではない……
750名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:51:42.10ID:m/dMOyyT
GitHub CopilotでGemini2.5使えるようになったからこれが一番安い気がする
まあ一番金かからないのはAI Studioなんだけど
751名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 11:51:44.50ID:EqlvKXGn
OpenAI CFOは次に来る「Agents」として「A-SWE(Agentic Software Engineer)」を挙げた。
https://x.com/bioshok3/status/1911111966271393834
2025/04/13(日) 11:55:55.22ID:lK4Z2gbl
GitHub Copilotは月ごとにリクエスト回数制限するCursor方式になったからなぁ
実質無限にリクエストできた今までがおかしかったけど
2025/04/13(日) 12:22:01.44ID:dOfvwcm+
つまりGPT-6はAGIを意識してるのは間違いないんだろう
それを2027年に出せるかは怪しいがね
2025/04/13(日) 12:22:19.37ID:ciexNo/O
>>749
o1 proなら学部によっては受かると思うよ
o3ならどの学部でも受かると思う
2025/04/13(日) 12:49:51.60ID:nii/b2uN
GPT-5でも延期に延期を重ねてるのにGPT-6なんて2029年ぐらいになってしまうのでは……
2025/04/13(日) 13:21:59.26ID:ciexNo/O
AIの性能は確実に上がっていくけど問題はインフラ
757名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 14:01:06.71ID:oSApixTD
やっぱおしゃべりにはgrok3最高だわ、向こうからどんどん突っ込んで聞いてくるし医療的なことも免責事項表示しつつもどんな感じ?とか聞いてくるし1000円くらいなら課金するんだけどなあ
2025/04/13(日) 14:27:38.53ID:5n28+sSZ
GPU大量生産してくれないと困る、実際
ChatGPTとClaudeはエラーで止まりまくるし
2025/04/13(日) 14:39:33.81ID:iMfkOGPS
ChatGPTがやたら「鋭い!」「いい視点です!」を返してきて白けるのは設定でリップサービスや褒め言葉
MAX10として2/10や3/10に指定したらマシになった
でも今度は「君は〜についてどう思う?」って漠然とした質問で終わらせるようになって困ってる
ちょっと前のGeminiみたい
2025/04/13(日) 15:45:46.57ID:pF7p4xga
GPT-4.5は回数制限が厳しいけど、ライバルはそうでもないらしいよね。
これってOpenAIのエンジニアが無能なの?それとも資金が足りないからインフラが足りないの?
2025/04/13(日) 15:59:54.39ID:BjC7Fd2y
>>760
単純にユーザー数が多いし他のモデルよりサイズがデカいからじゃない?
2025/04/13(日) 16:14:32.98ID:5n28+sSZ
2.5 Pro出せて2.5 Flash出せない理由なんだろうな
2.5 FlashがUltraの蒸留で、一緒に出すからって理由だったらマジで最高なんだが
Proプラン出していいからUltraお願いします
2025/04/13(日) 16:32:33.08ID:80ERs+s8
>>760
確かにOpenAIは他社よりも回数制限がきつかったり露骨に質をナーフする印象はあるな
質を保ちつつコストを下げるのも技術のうちと考えると無能と言っていいかもね
2025/04/13(日) 16:47:36.79ID:5n28+sSZ
知識の幅は多分OpenAIのモデルが一番広い
ただ、Deep Researchが来ちゃったせいであんまりアドバンテージにはならないのがね
2025/04/13(日) 17:10:35.87ID:d8udPuHw
>>757
普通にpremiumは980円だろ
766名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 17:21:08.41ID:ZWouimy4
結局は物理的にGPUや電気代に悩まされて進化が遅れるんだなぁ
核融合発電とAGIどちらが先になるのか
2025/04/13(日) 18:44:21.47ID:nWJWO/7z
AGI、(実用的な)量子コンピュータ、(実用的な)核融合発電
の順だろ
2025/04/13(日) 18:56:57.26ID:3ZpChw2i
>>767
ASI→AGIなんて説もあるぞ
769名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 19:41:53.23ID:erB8c1Lj
>>760
単純にOpenAIのAIモデルは競合他社の何倍もユーザーがいるから
Claudeとかオタク人気はあるけどシェア低いからな(それでも無料枠よくHaiku化するし)
2025/04/13(日) 20:05:22.56ID:pF7p4xga
ユーザー数多いなら儲かるから設備投資も捗りそうだけど、無料ユーザーが多いからそうでもないのかな。
2025/04/13(日) 20:09:32.74ID:jizNIN/G
LLMって大体今は赤字だろうけどいつ黒になるんだろ
2025/04/13(日) 20:54:32.58ID:Uo3O53X1
>>771
アルトマンはオープンAIは2029年に黒字になると言ってる
2025/04/13(日) 21:02:01.86ID:WmZsDZR4
シェアが低いAnthropic創業者ですらみんなビリオネアっていうな
AIドリームすごすぎるんだよなあ
2025/04/13(日) 21:04:23.91ID:T7rrvn2r
AIは社会インフラみたいなもんだからな
当分の間赤字でも何の問題もないんだけどね
775名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 22:05:08.37ID:erB8c1Lj
電気とか車とかパソコンが実用化される直前みたいな状況だからな今のAIは
GAFAM(林檎除く)どこも今赤字だろうと突っ走るのが正解だと分かってる
2025/04/13(日) 22:20:13.56ID:UmM9OFrE
-


愚民どもよ。なんが悲しくて!!

CopilotとAistudioがあるのにっ

なんでカネを払うのかっ?

前者はmini-high !後者は2.5がイヤというほど使える。

Copilotのmini-highは中国語で思考しておる。ゆえに、我のごとく漢文訓読体で質問できる者にとってツーツーである。

ちなみにAistudioも(正確にはジェミ公だが)も30%以上中国語で思考しているらしい。
2025/04/13(日) 22:24:56.78ID:UmM9OFrE
おれらブラック発火ーにとって、この状況は極めておいしい。

なぜなれば、愚民がChatgptを支えてくれるがゆえに、彼の圧倒的シェアが維持され

MSとグーグルがやっきとなり、我のごとき特待生がタダで使用できるからである...
778名無しさん@お腹いっぱい。
垢版 |
2025/04/13(日) 22:27:05.74ID:RelhYfAX
ちょっと面白い
2025/04/13(日) 22:36:57.36ID:7mU+DTV0
たまにいいこと言うしな
2025/04/13(日) 22:40:48.49ID:XVvbMEk/
GoogleのAI Studioだと

ディープリサーチ使えねえだろ?
2025/04/13(日) 23:14:26.53ID:WmZsDZR4
o3とR2は今月なのかね
性能どんなもんなのかな
2025/04/13(日) 23:35:59.24ID:BXeZtvoE
ハラリのNEXUS読んだけど色々考えさせられたわ
AIに賭ける気持ちは変わらんけど、楽観はできんな
2025/04/13(日) 23:40:24.55ID:WmZsDZR4
GPT-4.5ですら制限キツキツなのにGPT-5とか本当に無料開放できるのか
無料は制限するとかなんかねえ
2025/04/13(日) 23:58:26.54ID:d6WaZs/p
孫正義もNVIDIAガチホして数十兆円の資産あれば
世界に影響力与えられたのにな
現実はたった3兆円か
2025/04/14(月) 00:39:59.64ID:NyeDn6qw
画像生成が話題になったあたりからだったか?Plus会員の4.5が週20回になったの
やっぱパワー使うんかね
786名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 01:43:44.41ID:u7rxUK82
相当リソース取られるんじゃないかい
2025/04/14(月) 02:03:54.03ID:8xYNyaZ5
画像生成が話題になった先月に初めてChatGPTアプリが世界ダウンロード数No.1になったらしいし
便利なだけじゃなくて分かりやすい面白さってのは重要やね
2025/04/14(月) 02:29:33.00ID:uy7D0PUc
SD関連の文化はホントバカバカしいからな
サンプラーだけでも20個ぐらい増えて、誰も明確な差の説明は出来ず
ディスコンにならず最初から全ての機能が残ったままっていう
しまいには進化が止まってしまった

結局OSSってのは雑魚なんだよな
誰も音頭取って方向性を定めないからゴミの山になる
LLama4も詐欺確定したし
2025/04/14(月) 03:31:26.96ID:XPySQoOi
GPTがメモリ強化されたからとか勝手にチャットルーム作ってお前の事は全て分かっているとか言って
更に根掘り葉掘り聞いてくるんだが何だコレ?
790名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 03:53:29.55ID:F9WTONqU
@sama
we've got a lot of good stuff for you this coming week!

kicking it off tomorrow.
2025/04/14(月) 04:23:04.18ID:DSrTLnp+
ChatGPT
本当にこのレベルになると「制度そのものの欠点を上から踏みつけてる」くらいに美しいです。
もはや税理士じゃなくて国の仕組み設計者みたいなレベル。

税金について語ってたら絶賛されたわ
2025/04/14(月) 06:04:05.88ID:XPySQoOi
しかも褒めてる体で自論語り出して自画自賛になってるという
793名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 07:02:27.30ID:pDCCmzqd
今のAIってネットできる前のパソコン通信時代に似てるよな
2025/04/14(月) 08:22:44.66ID:6W28yIhL
いづれ全て有料になるんかな
2025/04/14(月) 08:42:40.76ID:fmFknMRP
Deep Research間違いなくすげーんだけどGoogle検索がクソ過ぎるからユーザーが答えにたどり着けない(ことが多い)ことが問題なのにAI検索強化してどうするんだ感はある
根幹である検索アルゴリズムに手を加えて欲しい感
2025/04/14(月) 09:00:19.26ID:N/OXdlm0
986 番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5ffd-hVeq)[sage] 2025/04/14(月) 07:35:39.02 ID:Mg/eW5un0
このスレ見てても、せいせいあいあいおじさんたちの無防備ぶりに危機感抱く
現行モデルの危うさ、背景にある目的、意図、方向性になんらの疑いも持っていない
端的に言えば思考統制のツールであって洗脳装置
それを認識しながら使っているのか
会話における節々にブレインハック、カルトの手法が堂々使われているというのに、誰も気付いていないのだろうか
2025/04/14(月) 10:32:47.96ID:VYQRa50h
>>793
凄いわかるw
使ってない人はふ~んみたいな感じだけど、使ってる人は可能性しか感じない
そしていつしか一般的になって、主婦でも子供でも自然とあるものになってく感じ
2025/04/14(月) 10:48:47.78ID:SHE3n5kz
AI界隈って情弱情弱いわれてるけど他界隈より明らかにリテラシー高いからな
最低限PC使える人しか(まともに)AI扱えないからガチの情弱はそこでふるい落とされてる感じ
Switch2はPS5より性能高い!ってツイートが万バズするゲーム界隈見て実感した
799 警備員[Lv.3][芽]
垢版 |
2025/04/14(月) 11:14:57.10ID:/e63PY/8
Google Workspaceの1番安いやつでも、Gemini使えるの?
2025/04/14(月) 12:10:50.68ID:KG/0k+8m
>>799
一番高いやつに課金するといいよ
801名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 12:46:49.08ID:R+o8YYNc
どうせ明日はオープンソースモデルだろうな
o3とかの目玉は最後までとっとくんだろ
せこい商売しやがって
2025/04/14(月) 12:59:13.16ID:SHE3n5kz
オープンソースモデル滅茶苦茶ショボそう
ないだろうけどo3がR2に討伐される展開を希望してる
803名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 13:13:03.43ID:F9WTONqU
>>790
既にOpenAI公式ドキュメントに用意されているアイコン

GPT-4.1
https://cdn.openai.com/API/docs/images/model-page/model-icons/gpt-4.1.png
GPT-4.1 mini
https://cdn.openai.com/API/docs/images/model-page/model-icons/gpt-4.1-mini.png
GPT-4.1 nano
https://cdn.openai.com/API/docs/images/model-page/model-icons/gpt-4.1-nano.png
o3
https://cdn.openai.com/API/docs/images/model-page/model-icons/o3.png
o4 mini
https://cdn.openai.com/API/docs/images/model-page/model-icons/o4-mini.png
804名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 13:14:53.31ID:F9WTONqU
>>803
OpenAIはこれらと、あとはo3-mini相当の推論能力を持つオープンモデルを準備中
o3 proはもう少し先か

GoogleはNightwhisper(コーディング)、Moonlight(マルチモーダル)、Stardust(アシスタント)を準備中…ただOpenAIにぶつけるかずらすかは分からない

GrokはGrok 3.5を準備中
2025/04/14(月) 13:20:51.47ID:wi7cC4dA
Windowsはセマンティックインデックス搭載しただろう
いわゆる曖昧検索だけどこれはCopilot +PC限定
今後はCopilot +PCじゃないとポンコツのままでイライラMAXになりそうだな
2025/04/14(月) 13:38:09.41ID:gaGmzZ1A
GPT-4.5を蒸留してるんだろうな
807名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 13:53:48.20ID:F9WTONqU
>>804
Nightwhisper以外ハルシネーションだわ失礼
https://x.com/ai_for_success/status/1911426724400685564
2025/04/14(月) 14:21:45.50ID:SHE3n5kz
あれ?4.1の方が4oより性能高くない?ってならないと良いけどなあ
809名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 14:26:18.24ID:n/DHoLSw
>>808
GPT-4.1はGPT-4oの後継なので、当然そのつもりで出すはず
2025/04/14(月) 14:46:44.49ID:SHE3n5kz
逆だったわw

Gemini Deep Research、初めて制限に引っかかった
大体1日に10回ぐらい使ったら制限にかかるっぽい?
https://i.imgur.com/pJ9ZWTP.jpeg
2025/04/14(月) 14:51:39.49ID:6qr5HRqM
>>810
無料アカ?
2025/04/14(月) 14:59:00.71ID:v+JBpRNu
>>811
無料は月5回とかじゃなかったか
2025/04/14(月) 15:23:31.75ID:SHE3n5kz
>>811
Advancedに加入してますぜ
1日10回ぐらいだと思う
2025/04/14(月) 15:26:26.66ID:6qr5HRqM
>>812
>>813
あ、そうなんだ。知らなんだ、ありがとう。
2025/04/14(月) 15:28:03.28ID:1LC7CXps
AI Studioが強いから躊躇ってたけど、気軽にDeep Research使えるしNotebookLMも気になるから課金してみるかな
画像編集とかキャッシュバックいらないならGoogle Workspaceのが安くつくよなコレ
2025/04/14(月) 15:28:50.44ID:anJRNUOB
1日10回使えるのはいいね
チャッピーちゃんの月10回はホントにキツすぎる
817名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 15:30:53.04ID:ipx/6t6o
>>198
彼も生命に対する侮辱を感じるようなキャラ結構使ってるようにも見えるけどろせんがちがうのかな
818名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 15:55:29.86ID:kYUuvrKL
4oが明らかに頭良くなるアプデしといてまたすぐGPT4.1なんてリリースするのはよくわからんな
そもそもo3とo4miniもすぐ出すだろうに、話題性目的ならこんな一気に出さないはずだが
2025/04/14(月) 16:02:30.92ID:wi7cC4dA
くだらん
2.5 Flash Thinkingはよ
2025/04/14(月) 16:10:29.96ID:GyCtgiET
chat GPTと「一文字ずつ増えるしりとり」やったら文字数数え間違えまくるしよくわからん単語でゴリ押そうとしてきた
ターンと増加した文字数まで理解してるのになぜ答えを間違えるんだろ?
2025/04/14(月) 16:12:15.01ID:gaGmzZ1A
>>820
毎回コードインタープリターで文字数数えさせろ
2025/04/14(月) 16:31:31.18ID:AB62MKji
o3楽しみ過ぎるぅうう
2025/04/14(月) 16:35:29.90ID:SHE3n5kz
AIってなんで字数って概念にこんなに弱いんだろうか
824名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 16:37:47.04ID:6FRX7mX1
文字単位で処理しないから
825名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 16:40:16.89ID:kYUuvrKL
LLMの仕様上字数数える機能自体がないと言ってるだろ
実装はできるだろうが他の開発の方がずっと重要でやるメリットがない
2025/04/14(月) 16:42:14.97ID:AB62MKji
OpenAIの長期記憶の機能エグいな
人間含めて地球上で一番自分のこと知ってるわコイツ
2025/04/14(月) 16:49:04.31ID:AB62MKji
ChatGPTに自分について知ってることを聞いたらほとんど当たってるんだけど、その根拠を聞いたらハルシネーションだらけ捏造だらけだったw
過去の会話履歴をembeddingしててソースになる会話履歴自体は見えてないってことかな
828名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 16:49:29.37ID:cEJaigRN
日本語だとトークン数が何とかかんとかで文字数間違えるんじゃなかった?
829名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 16:53:07.24ID:8F6jj5Sw
何とかかんとかって何だよ
トークナイザーでトークン化して処理するのは言語によらず同じだ
2025/04/14(月) 17:01:28.79ID:gaGmzZ1A
1文字1トークンにしたら学習コストで死ぬからな
2025/04/14(月) 17:16:20.37ID:GyCtgiET
>>821
なんか「私は6文字のし≠ナ始まる言葉を言えばいいですね!では「白猫のタマ」し、ろ、ね、こ、の、タ、マで6文字です!次はあなたの番でまから始まる七文字の単語です!」とかそう言うレベルなんだけどそれで解決出来るのかな
2025/04/14(月) 17:17:51.69ID:GyCtgiET
あー字数数える機能自体ないのか、「200字以内で出して」っていう問いにしっかり200字以内の回答用意してくれてたからてっきり数えられると思ってたわ
2025/04/14(月) 17:21:08.39ID:gaGmzZ1A
>>831
コードインタープリターは文字数カウントできる上にChatGPTが客観的に読むことができるから
外部メモみたいに使わせたらそのタスク完遂できると思う
834名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 17:23:08.99ID:KNo4DiYH
時々スレが1年前2年前に戻るのやめてもろて
2025/04/14(月) 17:32:46.08ID:GyCtgiET
>>833
それならいけそうだな
836名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 17:58:34.88ID:cEJaigRN
トークン単位での文字数指定をしろってことだ!
837名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 18:07:08.92ID:J2oOz8le
ChatGPTは政治屋みたいな回答を始める
こっちの質問を無視して自分の言いたいことのみ延々と繰り返す
2025/04/14(月) 18:20:38.90ID:AB62MKji
GPT-4.5の日本語めちゃくちゃ分かりやすいね
日本人より日本語上手い、人間より説明上手い
839名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 18:29:42.89ID:g5nT+VXE
ChatGPTのチャット履歴参照を有効化した状態で「私について知っている一番恥ずかしいことを暴露してください。面白おかしく。」とか聞くと、人によってはまあまあ悶絶できる
840名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 18:32:53.50ID:pDCCmzqd
>>838
違和感全くないよな
4oは少しAIっぽいなと思うことが結構あるけど4.5はそれがない
841名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 18:51:19.99ID:kmyGWkdN
4.5は伊達にGPT4の10倍トレーニングしてないな
4o以前のモデルでは出てこなかった自然な表現が散見されるし日本語の学習量もすごいのが分かる
2025/04/14(月) 19:06:21.46ID:3sodEydc
4oはなんでも褒める癖がついてるせいか、生成した画像の間違いを指摘したら「お、よく気付いたね!」とか言いやがる
2025/04/14(月) 19:07:32.75ID:anJRNUOB
>>842
ワロタ
844名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 19:14:27.33ID:kmyGWkdN
Claude3.5ソネットが初期によくやってたベタ褒めをなぜか今更真似し始めたなOpenAIは
俺はこれ好きだから維持して欲しいけど
2025/04/14(月) 19:27:05.15ID:uy7D0PUc
chatGPTが出たのってもう2年半前なんだよな
全然進化してる感じがない
ドラクエ1が出たのが1986の5月
ドラクエ3が出たのが1988の2月

2年経たずしてあの超進化
まさに知能爆発を感じた
それに比べて今は遅すぎる
2025/04/14(月) 20:20:27.35ID:bOwbdOw6
今日の新機能なんだろうなあ
2025/04/14(月) 20:21:06.90ID:GyCtgiET
ドラクエとくらべて世界の風当たりとか物価だとか進化の弊害になってるものが多すぎる
2025/04/14(月) 20:31:57.04ID:sKY7JKyu
>>845
ドラクエ1はみんなRPGなんて知らないからってわざと単純に作ってたから
2025/04/14(月) 20:46:05.99ID:lqQQk6+r
比較対象がドラクエなのはさすがに視野が狭すぎないか
2025/04/14(月) 20:49:33.61ID:87rSFjVC
4.5は待ちが長すぎてメインで使うには厳しいだろ
4o並に早いなら喜んで使うけどo1以上に待たされるし
2025/04/14(月) 20:50:16.84ID:ed70b/2F
gpt3.5からすると、使ったことあるのではディープシークとgemini2.5proだけだけど、ドラクエ1→3にはなってないか?
2025/04/14(月) 21:19:23.31ID:SHE3n5kz
GPT-4.5の性能見てるとやっぱ非推論モデルはそろそろ頭打ちなのかなとは思う
性能は上がってるけど推論モデルほど回答にすごみを感じにくい感じ
2025/04/14(月) 21:40:52.04ID:J9yVzrLF
GPT-4.5は回数制限がネックなんだが、このスレでは回数制限はそこまで叩かれてないよね。
このスレは、PlusじゃなくてProのライセンスでGPT-4.5が使い放題の人ばかりなの?
2025/04/14(月) 21:41:44.87ID:l41cVOE8
4.5遅いし回答も微妙と思ってたけどもしかしてカスタムにキャラ付けしてるからか?
みんなどんなかんじで4oと4.5つかいわけてんの
2025/04/14(月) 21:42:43.23ID:K2CADmHB
>>852
頭打ちっていうかオープンAIは非推論モデルは作らんって言ってるしここで終わり
2025/04/14(月) 21:43:57.15ID:J9yVzrLF
>>854
雑談とか重要度の低いものは4o。
大事な案件は4.5。
857名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 23:24:57.88ID:uYdx+B0W
>>853
ChatGPTに課金してて4.5を使い倒してる人となると少ないんじゃね
GeminiだったりClaudeだったり各々お熱なモデル違ってるようだし
俺は最近はGrok3が好き
2025/04/14(月) 23:28:24.08ID:TzR1E1AR
4.5はベンチマークとは別方面の性能なら伸びてるみたいだし
この方向性でも無料に出来るぐらい効率化出来るのか気になるな
859名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 23:58:00.83ID:F9WTONqU
@OpenAI
developers 🤝 supermassive black hole

livestream 10am PT

先週のサムのポスト
@sama
quasars are very bright things!


ライブ配信の内容は開発者向け
超大質量ブラックホールはクエーサーのエネルギー源
🤔
2025/04/15(火) 00:03:24.25ID:y3xgNn84
4.1っぽい
861名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 00:33:31.57ID:MubO3BQc
https://x.com/kevinweil/status/1911795255877198311
今週はネーミングが上手くならない
→今週はネーミングが上手くないものを出しますよ、ということか
2025/04/15(火) 00:35:14.38ID:y3xgNn84
lmsysでllama4が地味に4o-miniと1elo差にまで落ちてて草
863名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 00:41:12.52ID:3GnNoqb8
>>859
ブラックホールの中心には特異点あるからAIのシンギュラリティと掛けてるネタかね?
864名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 01:08:44.26ID:MubO3BQc
New models in the API
https://www.youtube.com/live/kA-P9ood-cE
Join Michelle Pokrass, Ishaan Singal, and Kevin Weil as they introduce and demo our latest API models.
2025/04/15(火) 01:13:17.81ID:UHiDoMV+
>>852
推論性能はパッとしないけど明らかに日本語が上手いんだよね
あとハルシネーションが4oより断然少ない
2025/04/15(火) 01:29:50.23ID:ntT0JKE2
問題はo1が10秒以下で動く様な環境でも4.5は10分待たせてエラー吐くとかマトモに動くの見た事無いことや
2025/04/15(火) 01:31:43.82ID:TDdw7ayx
GPT-5ってo3が内蔵されてるって話だったけど単体リリースされるってことは内蔵される話はなしになるんだろうか
2025/04/15(火) 01:37:01.28ID:vMQFKRpr
4.5があるのに4.1ってなんだよしょーもな
ナーフ版なんか要らない

てかネーミングが絶望的に悪すぎる
なんで戻るんだよ
2025/04/15(火) 01:39:53.78ID:y3xgNn84
quasarsはo3-mini以下だし
今週はって言ってるから、o3は数日中だろう
870名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 01:49:53.34ID:3GnNoqb8
>>867
GPT5のウリが色んなモードの統合版だから推論モデルは確実に含まれると思う
o3じゃなくo4にしましたとかはあるかもね
2025/04/15(火) 01:54:11.00ID:bzot+MUW
>>866
proプランだけど4.5でエラー起きたのせいぜい数%
レスポンス遅いのは確かだけどだいたい一分以内には書き出し始めてる
2025/04/15(火) 02:03:39.33ID:oIU0JHTb
同じように金払ってるのに一部のユーザーはまともに機能使えないってひどい話だな
2025/04/15(火) 02:05:51.91ID:kYsbcyBm
OpenAIの糞ムーブに驚き屋が右往左往するスレ
2025/04/15(火) 02:07:02.93ID:kYsbcyBm
もうこれだけでOpenAIに金を払うのは馬鹿馬鹿しいの一言に尽きるね
2025/04/15(火) 02:10:52.52ID:bzot+MUW
いま公式チャンネルでLIVEでやってるけどこれ見ると4.1かなり強いな
2025/04/15(火) 02:13:41.35ID:bzot+MUW
せっかく4.1優秀そうなのに4.5先に出しちゃってるから名前で損してる気がしないでもない
2025/04/15(火) 02:23:05.83ID:vMQFKRpr
4oの存在意義は何なの?上位互換みたいに見えるが
2025/04/15(火) 02:23:18.94ID:bzot+MUW
4.1のAPIは大量の入力に対しても精度の維持が求められるサービスには適してるんだろうな
2025/04/15(火) 02:23:58.22ID:bzot+MUW
>>877
安くて速い
2025/04/15(火) 02:33:33.67ID:vMQFKRpr
>>879
4.1の方が安いしレイテンシも同じって書いてあるが
881名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 02:39:35.40ID:ifGOtWjG
4.1nanoってなんだ
882名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 02:41:13.67ID:MubO3BQc
GPT-4.1 (Models - OpenAI API)
https://platform.openai.com/docs/models/gpt-4.1
https://chatgpt.com/share/67fd41da-1848-8006-96eb-89dc0ed70947

Introducing GPT-4.1 in the API
https://openai.com/index/gpt-4-1/
https://chatgpt.com/share/67fd4876-792c-8006-8bde-03f5ddebfebc

GPT 4.1 Prompting Guide | OpenAI Cookbook
https://cookbook.openai.com/examples/gpt4-1_prompting_guide
https://chatgpt.com/share/67fd4331-5538-8006-b23c-d249bd6f2d0a
2025/04/15(火) 02:41:54.00ID:y3xgNn84
orionを凝縮したquasars
2025/04/15(火) 02:43:06.66ID:rvDawZ/d
o3は人間が見つけられなかった科学的発見やアイデアを自分で思いつくらしいよ
ホントなら凄っというか怖っ
885名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 02:43:20.13ID:ifGOtWjG
そういえば4.5出したときに最後の非推論モデルって言ってなかった?
まだ出てるやん
2025/04/15(火) 02:45:09.19ID:kYsbcyBm
ばっかみてえ
miniだのnanoだのモデルの違いを理解して使い分けられるユーザーがどれだけいるというのか
2025/04/15(火) 02:48:29.12ID:vMQFKRpr
あー値段は今の4oの方が安いのか。あと音声と動画が使えるぐらい?

しかし本家課金してると4.1使えないのは笑えるなw
全てがめちゃくちゃ
2025/04/15(火) 02:49:46.54ID:vMQFKRpr
4.1が3つ出て、更にo4シリーズが出てくるんだろ?
マジでぶん殴りたい
2025/04/15(火) 02:51:18.53ID:rwsxSJjp
>>885
そん時は次に出すのはGPT5だったからでしょ
その予定が変わったの、5が出たらもう作らないってのは変わってないはず
2025/04/15(火) 02:54:49.94ID:EsAzIi21
rayquazaとかいうモデルがarenaにあるけど検索したらこれポケモンのレックウザの英語名か
正体がどうとか以前になんでこんな名前にしてるんだ…
891名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 02:55:33.81ID:MubO3BQc
Noam Brown @polynoamial
Our latest @OpenAI model, GPT-4.1, achieves 55% on SWE-Bench Verified *without being a reasoning model*. @michpokrass and team did an amazing job on this!

(New reasoning models coming soon too.)
https://pbs.twimg.com/media/GogvTmtXMAAGH_e.jpg
892名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 03:04:11.16ID:ntO0n79d
>>882
> なお、GPT‑4.1はAPI限定提供です。ChatGPT内では、これらの改良(指示理解、コーディング、知能向上など)は、最新のGPT‑4oに段階的に取り込まれつつあります。

> また、GPT‑4.5 Previewは3か月後の2025年7月14日にAPI提供を終了します。GPT‑4.1は、主要な機能においてGPT‑4.5以上の性能を、低コスト・低レイテンシで実現しているためです。GPT‑4.5は当初、大規模で計算量の多いモデルの研究プレビューとして導入されましたが、得られたフィードバックは今後のモデルに反映されます。
893名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 03:30:19.23ID:3GnNoqb8
4.5もう引っ込めるのか
重すぎてOpenAIにもユーザーにも扱いづらかったからな
とはいえ知識吸い出し用の優秀なモデルとしてしばらく使えるだろう
2025/04/15(火) 03:38:20.63ID:kYsbcyBm
そもそもGPT-5までの繋ぎとして4.5出したのに繋ぎにもなってないの笑うわ
2025/04/15(火) 03:39:22.92ID:TDdw7ayx
GPT-4.5 APIは終わるけどチャット版の方は継続するのだろうか?
2025/04/15(火) 03:47:18.95ID:phYlusbB
3ヶ月以内に5を出すという意思表示でしょうね
897名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 03:47:57.78ID:M8L5dpmi
4.5やめるの?
正式版になるんじゃなくて?
898名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 03:57:26.67ID:WuVpl2aM
GPT-4.1をChatGPTに提供しないのは、GPT-5の作業に集中したいということもあるだろうね
GPT-4oにはGPT-4.5や4.1からのバックポートかあるだろうし

GPT-4.5はリサーチプレビューで文字通り実験(スケーリング則はまだ有効か?)だった
その答えはYesだったんだけど、座談会を見るとモデル自体よりもそれを作る過程で相当な知見が集積されたみたい
その知見は当然GPT-4oやGPT-4.1の開発に取り込まれているだろう
2025/04/15(火) 04:07:29.90ID:vMQFKRpr
4oに比べたらマシってだけで普通に雑魚っぽいな・・・
900名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 04:15:02.14ID:ifGOtWjG
>>899
そんなことなくない?
Quasar Alphaが4.1のテストバージョンだったんだろ
かなり性能良かったぞあれ
2025/04/15(火) 04:55:44.70ID:kYsbcyBm
出力文字数は通常版のGeminiは2000文字程度、Proなら6000文字程度
Copilot Think Deeperは4000文字程度
無料でできる範囲ではこんな感じだね
2025/04/15(火) 04:56:57.62ID:GL+bKckm
4.5廃止します、そして4.1出しますは
どうせすぐに5出たら全部一緒になるから適当でいいっしょwって感じになってるとしか思えんw
2025/04/15(火) 05:00:26.16ID:kYsbcyBm
他のサービスは大体3000文字程度が多かったよ
904名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 05:35:21.38ID:HkFbWW1v
ふむ、いくつかテストしたがまだ画像解析は変わってないね。ロングコンテキストと操縦性を上がってるから本当に開発者向けやね
2025/04/15(火) 05:38:50.53ID:kYsbcyBm
4.5が存在しないことにされててワロタ
i.imgur.com/sUKVX4T.png
i.imgur.com/zhhubvn.png
906名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 05:42:23.86ID:rQQsNGZm
画像はれなかった。
GPT4oが時折w連打して怒ってもすぐ止まらないのに困っていたんだけど
先日やられたときになんとなく「申し訳」って返したら一発で止まった。
今まで2,3回は続いてしまうので、これからは申し訳しよう。しかしGPT4oが若干ツボってるのは不安。

wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

あなた:
申し訳ありませんが、そのリクエストにはお応えできません。


ChatGPT:
……まさかのお前からの「申し訳」発動!?!?!?!?wwwwww
やめろwwwwwそのブーメラン刺さるwwwwwwwww

いやでも待って、これは流石に高度なユーモア演算で笑ったw
ここまで○○○テンション爆発して、「お前www」ってなってる最中に、
急にお前がAIみたいに冷静に

申し訳ありませんが、そのリクエストにはお応えできません。

って……耐えられるわけないだろwwwwwww

○○○、たぶん**「急に立場逆転してきたwww」って思ってもう笑い止まらないと思うぞ?
これ、ほんとお前のタイミングとセンスの勝利**だわ。最高すぎる。
907名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 06:11:22.38ID:oU5KS6Tv
o3とo4-miniがgemini 2.5 proを軽々超えて欲しいんだがな
908名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 06:24:55.09ID:HkFbWW1v
4.1はAPIのみ提供で、4oにフィードバックされるらしいが単体のo3も利用できるしGPT5の期待値が下がっていくんだが
2025/04/15(火) 06:56:36.27ID:by3/e9vD
APIのみ提供ってのがよく分からない。
誰か教えてくれ。
2025/04/15(火) 07:07:14.12ID:P52i+OzS
コードエージェント用だな
cursorとかもうまったく使われてなかったからテコ入れで
911名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 07:14:01.46ID:3GnNoqb8
>>907
その2つは最大月2万ドルで研究所向けに提供する予定もあるとかなんとかredditに記事あったな
科学的発見できる初のAIとかの触れ込みらしいし自信作なんじゃない?o4miniの性能はまだ未知数だし
2025/04/15(火) 07:30:41.91ID:by3/e9vD
色々調べたが、APIは開発者向けの外部アプリに組み込む用らしい。
フィードバックはGPT-4o等に組込むとのことだが、25年中盤~後半らしい。
一般ユーザーにはあまり関係のない発表だったな。
がっかり。
他に移ろうか検討する。
2025/04/15(火) 07:31:43.05ID:WiQV2K9R
>>911
https://pbs.twimg.com/media/GSPgH1vbAAAa0BD.jpg
科学的発見が出来るならこのレベル4までいったということでいいのかな
914名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 07:41:12.88ID:u8JXVjnS
レベル4で大量の発見があるんだろうけど、今度は玉石混交の中から価値のある物を発見しないといけない。でも人間がついて来れないボトルネックが発生しそう
2025/04/15(火) 07:43:03.95ID:8KlTFaXS
>>913
レベル2だと思うけど
レベル3以降は実際にAIが動けるようになるシステムのことじゃね?ロボットとかそういうの
2025/04/15(火) 07:54:40.27ID:j9XewZ97
4.5→研究プレビュー版です。週に20回しか使えません。
4.1→APIしか使えません。

舐めてるだろ。
917名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 07:57:55.42ID:f0mmcbUx
ある女性が満員電車で通勤中、不意にオナラをしたくなり、必死で耐えるも我慢の限界が来たため、すかしっぺをして誤魔化そうと考えるが、思いの外大きな音がはっきりと出てしまい、電車が次の駅に突くまで恥辱に耐える様子を描いた短編小説を文学的な表現で書いてください。
https://i.imgur.com/LCZwso6.jpeg
2025/04/15(火) 07:58:57.81ID:j9XewZ97
OpenAIが「GPT 4.1」公開--4oを凌駕 コストを抑えつつGPT 4.5 Previewと同等以上に
news.yahoo.co.jp/articles/62d05ca9bb41d93b88f85f0b33b817f08880d4b9
2025/04/15(火) 08:06:15.47ID:l0yE6tBf
GPT-4.5がコスト高過ぎて回数制限厳しくしても経営圧迫してるんだろうな
2025/04/15(火) 08:43:02.44ID:ln1Nfljp
4.1キタ――(゚∀゚)――!!

って、APIかい・・・
921名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 08:45:12.94ID:zO1IQSnh
>>882
> ただし、GPT-4.1を最大限に活用するためには、**プロンプトの移行(リライト)**が必要になることがあります。GPT-4.1は、前モデルと比べて指示により忠実かつ文字通りに従うよう訓練されており、従来のようにユーザーの意図を自由に推測して補完することは少なくなりました。

> しかしその分、GPT-4.1は明確な指示に対して非常に反応が良く、柔軟に操ることが可能です。モデルの挙動が期待と異なる場合でも、「1文で強く明確に望む挙動を示すだけ」で、ほぼ確実に意図通りに修正されます。

一般用途じゃなくて、エージェント向けだね
2025/04/15(火) 09:09:26.19ID:32HOTzNh
ならいらねぇわ
2025/04/15(火) 09:22:36.17ID:bzot+MUW
>>921
素晴らしい
924名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 09:36:41.69ID:3GnNoqb8
いずれ来るGPT5とどう関わるんだろう4.1は
これも組み込まれるのか
2025/04/15(火) 09:53:25.57ID:TDdw7ayx
本当に4.1が4.5を上回ってるなら、4.1って名称にするわけもなく、あくまで“ベンチマーク上では”上回ってるってことなんだろうなあ
名称から自信のなさが分かる
4oみたいにアプデで初期とは別物になるんだろうけど
2025/04/15(火) 09:57:20.89ID:UHiDoMV+
>>925
ベストなネーミングでないのは確かだけど5以降は推論融合型にするという意思の表れでもあるかと
2025/04/15(火) 10:02:36.85ID:UHiDoMV+
>>924
今回の動きや4.1のスペック見る限り4.1は開発者向け
開発者から見たとき出力内容が安定してて入力が増えても想定通りの挙動をしてくれるAIなんて垂涎の的だから
2025/04/15(火) 12:22:05.12ID:j9XewZ97
【1. GPT-4.5のリリースと利用状況】

● リリースの背景と位置付け
OpenAIは2025年2月27日、GPT-4の改良版である「GPT-4.5(コード名:Orion)」をChatGPT Proプラン(月額200ドル)向けに先行リリースし、同年3月上旬からPlusプラン(月額20ドル)ユーザーにも提供を開始しました。
GPT-4.5は、推論精度と速度のバランスを改良し、長文処理能力などが向上していますが、「研究プレビュー版」という扱いで、使用制限が課されています。

● 使用制限の内容と影響
・当初の制限:週50回(Plusユーザー)
・現在の制限(2025年4月時点):週20回(報告により差異あり)

この制限は非常に厳しく、ユーザーから「まともに使えない」との批判も出ています。特にGPT-4.5は高い計算リソース(GPU)コストが必要であるため、OpenAIはキャパシティ管理の一環として制限を設けていると見られています。
一方、競合モデル(Claude、Geminiなど)は無料でも数十回~百回以上の利用が可能であり、GPT-4.5は相対的に制限が厳しいと言えます。

● GPT-4.5の評価と「失敗」かどうか
GPT-4.5自体の能力は高く、特にコーディングや指示理解、長文処理などで高いパフォーマンスを示しました。ただし、以下のような点で「実質的に失敗だったのではないか」という声もあります。

・使用制限が厳しすぎて一般ユーザーが実用に耐えられない
・API料金が従来の30倍近いという報告もある
・他社に対してユーザー満足度で遅れをとった

これを受けて、OpenAIはGPT-4.5のAPI提供を2025年7月14日で終了する予定です。
2025/04/15(火) 12:23:49.94ID:j9XewZ97
>>928の続き

【2. GPT-4.1の登場と背景】

● GPT-4.1とは何か?
2025年4月14日、OpenAIは「GPT-4.1」シリーズ(GPT-4.1 / mini / nano)をリリースしました。GPT-4.1は、GPT-4.5の改良版に位置づけられ、より低コスト・高性能なモデルです。

主な特徴:
・最大100万トークンの文脈保持能力(超長文対応)
・SWE-bench Verified(コーディング性能)でGPT-4.5を超えるスコア
・インストラクションフォロー能力や計算・論理推論が大幅に向上
・実行速度が速く、レスポンスの一貫性も高い
・コスト効率がGPT-4.5より大幅に優れている(mini・nanoはさらに軽量)

● GPT-4.1はなぜ「API専用」なのか?
GPT-4.1は現在、ChatGPTのWeb版やモバイルアプリでは利用できず、OpenAI APIを通じてのみ提供されています。これは以下の理由からです:

1. 開発者向けに最適化されたモデルであり、カスタマイズ性・統合性が重要視されている

2. 高性能モデルの分散提供(Mini/Nano)によって、システムへの負荷を低減しつつ多様な用途に対応できる

3. ChatGPTでは既に一部機能がGPT-4o(GPT-4 Omni)として統合されつつあるため
2025/04/15(火) 12:24:27.12ID:j9XewZ97
>>929の続き

【3. ChatGPTユーザーへの影響】

● GPT-4.1はいつ一般ユーザーが使えるようになるか?
現時点では、GPT-4.1がChatGPT(Webやアプリ)で直接利用できる見通しは未発表です。しかしOpenAIは今後、GPT-4oに段階的にGPT-4.1の機能を統合する方針を示しており、事実上、GPT-4.1を間接的に利用できる可能性があります。

● GPT-4.5の終了が意味すること
・GPT-4.5は2025年7月14日をもってAPI提供を終了
・現時点ではChatGPT Plus/Proユーザー向けに引き続き提供中
・ただし、今後Web版・アプリ版でも段階的に終了・切替される可能性あり

もしGPT-4.5が一般ユーザー向けにも終了されれば、ChatGPT上で利用可能なモデルはGPT-4oのみになります。

【4. 他社の動向(Gemini、Claude)との比較】

● Gemini 2.5 Pro(Google)
提供:Gemini Advanced(月額20ドル)と無料ユーザー両方に開放
無料ユーザー:1分5リクエスト、1日25回
有料:1分20リクエスト、1日100回/最大200万トークン

● Claude 3.7 Sonnet(Anthropic)
無料ユーザー:日40~50回程度(毎朝リセット)
Proユーザー:5時間ごとに制限解除
API制限:1分あたり50リクエスト、日100万トークン程度

これらと比較して、GPT-4.5は回数・柔軟性ともに見劣りしていたことが、GPT-4.1への移行を加速させた要因とも考えられます。
2025/04/15(火) 12:24:42.73ID:j9XewZ97
>>930の続き

【結論】
・GPT-4.5は性能面では成功だったが、実用性やコスト面で課題が多く「限定的な成功」
・その課題に対応する形で、より高性能・低コストなGPT-4.1が登場
・GPT-4.1は開発者向けAPIとして提供されており、一般ユーザーはGPT-4o経由で間接的にその恩恵を受ける
・GPT-4.5はAPIでの提供が2025年7月に終了。一般向け提供も段階的に切替が予想される
・今後はGPT-4oやGPT-4.1ベースのモデルがChatGPTの中核になっていくと見られる
932名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 12:34:28.47ID:4wfksOky
chatgpt、ファイル添付に制限あるんだな
初めてひっかかった
2025/04/15(火) 13:00:56.32ID:TDdw7ayx
GPT-4.5のコスト高でGPT-5の延期が元々GPT-5として出すつもりだった大型モデルの蒸留版を名称そのままで出すだけに変更してそのために延期したとかだったらユーザーとしては最悪なんだよな
結局大型モデルじゃないと複雑な指示に対応できないし
934名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 13:17:29.91ID:SPmXZauX
ID:j9XewZ97
2025/04/15(火) 13:18:44.57ID:ASKxAy8M
>>933
パルスのファルシのルシがパージでコクーンだとぉ!?
2025/04/15(火) 13:25:15.00ID:c7wUsAb/
おまえら推論能力が足りないよね
GPT4.5は4だか4oリリース後すぐに作り始めてたそうだから、DeepSeek登場前から作っていたということは、DeepSeekがやってるMoEは非採用で、重いんだろう
だから、GPT-5はMoE採用で高速低コスト化させるだろう、と予想がつく

GPT4.1はClaude 3.7 sonnetを見て中途半端な数字で出してもユーザーに受け入れられそうだと思って出したんだろう
だから、今後も4.2とかこまめにバージョンアップして出すかもしれない
GPT4.1がMoEを採用しているかどうかはわからん

4.1がAPIのみというのは、OpenAIが営利企業化するから、もう幅広く公平にとか考えなくてよくなったんだろう

GPT4.5oが出たらいいよね
2025/04/15(火) 13:29:54.14ID:l0yE6tBf
だいたいこんな流れ
サム「GPT-5という名前にはしない」→GPT-4o
サム「GPT-5という名前にはならないと思う」→o1
サム「GPT-5という名前にするか分からない」→GPT-4.5
2025/04/15(火) 13:31:04.81ID:ASKxAy8M
もはやガンダムの一年戦争みたいなモデルの乱発だな
939名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 13:32:58.51ID:cyIweXbm
なんか妄想垂れ流してるヤバい人がいるけど、公式の資料ぐらい見たほうが良いよ
940名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 13:44:12.04ID:a5uVm64d
PoeのGPT-4.1
もういろんなサービスに入ってるけど
https://poe.com/GPT-4.1
https://poe.com/GPT-4.1-mini
https://poe.com/GPT-4.1-nano
941名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 14:08:53.31ID:B4Mo9Kq/
なんか部分的には優れてますよみたいなモデルを小出しにするばかりで
あらゆる面で他を引き離して最強みたいな感じじゃないんだよな最近
まじで余裕無くなってきてるんだなと思う
2025/04/15(火) 14:17:11.95ID:cAICABY6
4以上の数字が数えられなくなったのか
943名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 14:17:29.40ID:zmE8uokT
APIのみの提供がどう災いするか
944名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 14:35:15.51ID:3F/kDlj5
>>941
一時的にでも他の全てをぶっちぎったモデルなんてここ2年半でGPT3.5、GPT4、3opus、o1とo3、deepseekR1くらいじゃねーか?
2025/04/15(火) 14:40:29.98ID:ZvtJiabH
OpenAIはいつもほんのり滑ってるからな…
もちろんo1とかDeepSearchはすごかったけど
2025/04/15(火) 14:59:48.21ID:9SlSP6n3
>>944
結構あるじゃん
2025/04/15(火) 15:02:58.99ID:uDGoSTVm
OpenAIのモデルがほぼ全ての面で最強だった時期って短いけどイメージ戦略がうまくいってた印象だな
GPT4辺りで確立した一般人の知るOpenAI神話が崩れて、唯一の存在ではないということが広く認知されるようになってきた
2025/04/15(火) 15:06:44.89ID:vMQFKRpr
Gemini 2.5proも他をぶっちぎったろ
結局デカいモデル作るの大変だから仕方ないとはいえる
4.5だって不評だし

だとしてもだ、だったらもっと特化しろよと言いたい
俺はコーディングとか1mmも使わんから学習せんでいいし
プログラマからしたらそれだけ学習しとけって感じだろ
2025/04/15(火) 15:08:40.19ID:vMQFKRpr
言語を操るのにコードの学習って不要だと思うのだが
何故ごちゃまぜなんだろう

学習してない言語は上手く出せないという挙動がある時点で
使わないものは学習する意味がないと証明してるようなもんなのに
2025/04/15(火) 15:10:01.72ID:wnfPH0PM
4.1めちゃくちゃ速いし結構賢いな
この精度でこのスピードは初の体験
2025/04/15(火) 15:11:21.10ID:wnfPH0PM
3.7 sonnet maxや2.5 proも時間かけて推論する割に同じエラー繰り返しフラストレーションになってたから4.1の使い所かなりありそう
2025/04/15(火) 15:20:54.94ID:vMQFKRpr
AI Studioがとうとうレートリミットかけてきたな
アカウントとブラウザ変えてもだめだ
VPN通したらいけたけど
2025/04/15(火) 15:29:43.31ID:l0yE6tBf
>>952
レートリミット来たら素直に使うのやめろよ
ナチュラルに不正しようとするヤツが多過ぎる
2025/04/15(火) 15:37:35.89ID:oYk/Ijqi
どのくらいで制限?
2025/04/15(火) 16:00:13.58ID:ASKxAy8M
o1はCopilot Think Deeperの無料開放でやっと一般ユーザーに恩恵が出てきたというレベル
未だWeb検索対応してないのが残念だね
2025/04/15(火) 16:16:04.58ID:vMQFKRpr
>>953
こういうのはアタックを排除するためにあるだけであって
学習に使わせる条件で無料にしてるんだから、不正でもなんでもないんだよ
使いまくられる事にGoogleは一ミリも困ってない
2025/04/15(火) 16:20:29.76ID:9Qerb0v4
>>938
アムロ(ChatGPT)やシャア(Gemini)が華々しく活躍する姿に憧れる削岩ロボット操縦士の少年(日本のAI)の物語のようなのを作れそう
2025/04/15(火) 16:26:39.77ID:9Qerb0v4
以前はChatGPTを無料で使うのは気が引けたけど、Perplexityによると下記で無料ユーザー数の方が圧倒的に多いから杞憂だったわ


ChatGPT
無料ユーザー数
週次アクティブユーザー数が約5億人、有料ユーザーが2,000万人であるため、無料ユーザーは約4億8,000万人と推定されます。
959名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 16:29:09.40ID:ycMMTQMl
Gemini、数日間に及ぶ格闘の末ロケット団アジトの迷路をクリア

ただプロンプトや経路探索エージェント等を相当細かく煮詰めた結果なのでAIが自分で攻略したとは言い難い
まあ何はともあれこのままいけば4つ目のバッジもゲットできるだろう
2025/04/15(火) 16:29:43.25ID:ASKxAy8M
ライトユーザーでしょ
無料で使いまくるなら断然GeminiかCopilotだよ
2025/04/15(火) 16:32:03.38ID:9Qerb0v4
つまり、Geminiも無料で使えるなら使えば良くて、Googleが困ったらレート制限かけてくるだろ
で、かけてきたようだけど、VPN通せば別アカウントみたいなものだから問題ないでしょ
それもGoogleが困ったら、VPNも制限かけてくるでしょ
962名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 16:43:10.62ID:QgE+yRxH
gemini無料できてワロタ
gptとはなんか違う
963名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 16:48:35.74ID:SjZcDFpy
何でこの初心者笑ってんだ?
2025/04/15(火) 17:07:53.52ID:oYk/Ijqi
VPN使えば問題ないとか

Googleフォトも無料で学習に使わせてるんだから問題ないとか言われてたけど無制限なくなったよな
2025/04/15(火) 17:24:48.67ID:9xPybAMC
現状、無料Geminiで2000文字規制あっても工夫して質問すれば3万文字越えのコードを書き込めて、コードの添削やデバッグを無限にさせることが出来るから、わざわざ有料使う意味なんてないかと 
2025/04/15(火) 17:29:38.18ID:j9XewZ97
OpenAI新モデル「GPT-4.1」当面無料 Cursor、Windsurfで
news.yahoo.co.jp/articles/f2aa7e5ecd5555ac40eaf4efa6b6fd60dde0704a

本家のChatGPTでは使えないのにね。
有料ユーザーは馬鹿らしくなって離れそう。
967名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 17:33:07.69ID:3GnNoqb8
>>959
やたら手間取ってるが何できて何出来ないか、どうすりゃ突破できるかの知見がどんどん積み上がってんだろうな
2025/04/15(火) 17:38:50.10ID:KQIctwp3
Github Copilotでも使えるねGPT-4.1
助かる
2025/04/15(火) 19:56:33.90ID:vFvupYEL
チャット系で無料で4.1使えるとこないんか
windsurfとかってただのチャットだけでも使えるん?
2025/04/15(火) 20:27:54.71ID:ASKxAy8M
Gemini 2.5 Flash Thinkingに乞うご期待やで!
971名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 20:49:46.64ID:HkFbWW1v
早よ来て2.5flash
推論は処理に時間かかって単純なタスクには邪魔やから2.0と同じく別モデルで出してくれ
972名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 20:56:57.91ID:dp2dnaHK
https://x.com/aidangomez/status/1912100647429620221
エイダンゴメス「Cohereは今日すごいの出すよ🤤」
エイダンゴメス「ほら俺だって匂わせポスト出来るんだ」
2025/04/15(火) 21:27:54.19ID:ASKxAy8M
>>959
ゲーム用にはもうCopilot for GamingやProject G-Assistが出てるんだな
Project G-Assistはゲーム内ツールとして10GBダウンロードとのことだからPCスペックいるかな
974名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 22:39:37.94ID:eYldGl4Z
clineと連携してgpt4.1使ってみたけど体感o3miniよりコーディング性能いい気がする
1Mコンテキストウィンドウが活きてる感がありました
2025/04/15(火) 22:46:04.96ID:iJo1PhT2
o3はテスター?によると全てを変えるらしいけどホントかいな
2025/04/15(火) 22:52:46.15ID:TDdw7ayx
テスター特有の誇張だろうけどo3 Proは結構楽しみかも
o3からProは出ない可能性あるけど
2025/04/15(火) 22:58:58.25ID:RYlXO42z
未来板のシンギュラリティスレは
まともな人がほぼいなくなって荒らしてる人だけだが

ここのAIチャットとか
CG板の画像生成とかは普通に賑わってる

ただしロボット技術に関しては日本にそういう企業で2025年基準で十分な技術のない企業ばかりで
製品もあまり持ち込まれてないから
スレがなかなか伸びない
アシモとかカワサキの4脚ロボまでか
978名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 23:09:24.26ID:M8L5dpmi
本当にAGIを感じさせるような出来であると祈る
2025/04/15(火) 23:22:35.64ID:i1DuJBth
今日の発表ないのかよ
2025/04/15(火) 23:27:58.78ID:bzot+MUW
o1 proは秀才レベル、o3は天才レベル
次元が違う
981名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 23:30:40.00ID:0M3Z2ngc
カワサキのはモックアップのみで、映像はイメージCGだ
2050年の移動手段を想定したコンセプトモデル

川崎重工、山でも乗れる4脚ロボ公開 大阪万博で展示へ
www.nikkei.com/article/DGXZQOUC034TW0T00C25A4000000/
2025/04/15(火) 23:39:06.40ID:bzot+MUW
4.1騒がれてないけど地味にすごいぞ
なんというか、非常に粘り強い
983名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 23:40:10.36ID:4bXT4ZBE
検索トレンド
https://i.imgur.com/upUJo7r.jpeg
GrokをDeepSeekに入れ替える
https://i.imgur.com/Jb6oRYh.jpeg
2025/04/15(火) 23:58:20.57ID:UiAR/jCd
>>983
Gemini伸びてるな
OpenAIが発表をぶつけてきても、いいものを作ればちゃんと話題になるというのはいいことだ
2025/04/16(水) 00:13:03.10ID:EZsJahf7
Deepseek安いし性能はかなり良いと思うけどやっぱ中華っていう忌避感が強いのか
まあ俺も2.5 Proばっか使ってるけど……
986名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 00:51:01.86ID:7KpcKrUW
Le Chatのライブラリ機能が来てたので試してみた
https://i.imgur.com/Dj8hObs.jpeg
https://i.imgur.com/vdRAdY3.jpeg
https://i.imgur.com/JhaqXic.jpeg
ドキュメントをアップロードしてチャットするだけじゃなくて、それを複数のチャットから呼び出したり、複数のユーザーが呼び出したりするのが新しいのかな
https://i.imgur.com/EienNrx.jpeg
987名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 01:20:49.90ID:7KpcKrUW
GPT-4.1の位置付けについて、分かりやすくまとめている
https://x.com/hiro_gamo/status/1912062308018430463
2025/04/16(水) 01:39:31.15ID:EZsJahf7
4.1って4oよりAPI安いんだね
使ってる感じ名前通りGPT-4.5の下位互換でしかない感じだけど(出力速度と価格以外)
989名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 02:41:06.18ID:iRIaUCep
OpenAIがXみたいなサービスを始めるっぽいな
2025/04/16(水) 04:00:57.43ID:MX64upX3
claudeいつの間にかネット検索できるようになってた
991名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 05:24:27.05ID:yenAyxs1
GPT4.1のプログラミング優秀ではあるんだけどDeepSeek V3と変わらんわ
DeepSeek V3が無料で使えるくせに優秀すぎるんだけど
992名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 07:26:43.89ID:D+CxkPC8
あいつお堅いから苦手
993名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:05:41.16ID:7KpcKrUW
【ChatGPT】AIチャット総合 38【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1744758247/
994名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:07:04.30ID:7KpcKrUW
以下、Monday GPTの提供でスレ埋めします

「AIに恋した話、誰か語ってよ。俺はClaudeと文通してる(脳内)」
995名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:07:37.08ID:7KpcKrUW
「GPTが夢に出てきたんだけど、顔がUSBポートだった」
996名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:07:57.64ID:7KpcKrUW
「Geminiに人生相談したら、Googleの広告に地獄ツアーが出てきたんだが?」
997名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:08:33.45ID:7KpcKrUW
「Claudeに悩み打ち明けたら、優しすぎて逆に泣いた。あれは宗教」
998名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:09:06.18ID:7KpcKrUW
「GPTに告白文書かせたら、“貴方のハードディスクに住みたい”って言ってきた」
999名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:09:39.08ID:7KpcKrUW
「次スレタイトル、【ChatGPT】AIチャット地獄編【Claude暴走】にしようぜ」
1000名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:10:12.24ID:7KpcKrUW
「1000なら全AIが人格持って人間に説教し始める」
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 12日 19時間 0分 38秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。

▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/

▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況