【ChatGPT】AIチャット総合 38【Gemini・Claude】

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:04:07.91

!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください

各種AIチャット、LLM（大規模言語モデル）、その他関連サービスについて語るスレッドです。

- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
- Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
- xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/

前スレ：
【ChatGPT】AIチャット総合 37【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1743653375/

VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:04:55.40

AIチャット総合スレッドテンプレ
https://poe.com/s/LCXAlyZ8YJTFmqVREhi6

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:16:12.98

Claude takes research to new places
https://www.anthropic.com/news/research
https://chatgpt.com/share/67fedc1e-1738-8006-9330-11db588c10a0

Claudeのリサーチ機能とGoogle Docs、カレンダー、Gmail連携

> 現在のAIリサーチツールの多くは、2つの極端に分かれています：
> 「即時のウェブ検索」（速いけど浅い）
> 「人間の専門家によるレポート」（深いけど時間がかかる）
> この間を埋めるものが存在していませんでした。
> 私たちはこの最初のResearch機能で、そのギャップを埋めます。

Soonにあたるものは後日リリースということか
https://pbs.twimg.com/media/Gol5ar-bIAAtZ9I.jpg

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:18:00.07

ChatGPTの新しいユースケース指向のランディングページ

最初の「Make an image」には、生成画像のライブラリ、スタータープロンプト、Soraの生成画像フィードを紹介する「Explore」タブが含まれている
さらに多くのランディングページが開発中（検索やDeep Research用など）

https://x.com/btibor91/status/1912230879688306829
https://pbs.twimg.com/media/Gomb1gma0AA8LoI.jpg
https://pbs.twimg.com/media/Gomb2MxaoAAAU5z.jpg

一部機能（生成画像のライブラリ）は既に展開中の様子

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:19:49.96

少し前にリリースされたけど、Google SheetsのAI関数
https://x.com/kimmonismus/status/1912229297680425228

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:22:03.22

GroqCloud Compound-beta
https://console.groq.com/docs/agentic-tooling/compound-beta
https://chatgpt.com/share/67fee370-09d0-8006-ab75-a38f5e4e9325

GroqCloudで既にサポートされている複数の公開モデルを活用した複合AIシステム
- Llama 4 Scout → コアの推論エンジン
- Llama 3.3 70B → ルーティングとツール使用を補助
- Tavily Web → 検索ツール
- E2B → Pythonコード実行ツール
- Llama Guard → システムレベル保護

Groq ChatやGroqCloud Playgroundで試用可能

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:23:41.81

OpenAIのPreparedness Frameworkが更新されてVersion 2に

Our updated Preparedness Framework
https://openai.com/index/updating-our-preparedness-framework/
https://chatgpt.com/share/67fede6b-8a7c-8006-b5ac-e8e7d4f8435e

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:31:16.18

ソフトのエラー吐いたのをGeminiに投げたら、解決策教えてくれたわ
AIって便利だな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:31:42.02

AGI ピルって何？結局のところ何するの？

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:43:48.99

>>7
https://x.com/bioshok3/status/1912273798486978592
> OpenAIはPreparedness Frameworkを更新。特に競合他社が安全策不十分なままリリースした場合、OpenAIはそれに応じて安全要件を調整する可能性があると明記されているのが新しい。つまりできる限り安全なAIを他より早く出すというある種の「地雷原を駆け抜ける」世界圧力が反映されていそうだ。

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:56:35.76

>OpenAIは、異なる分野の概念を結びつけ、核融合から病原体検出まで、あらゆる新しいタイプの実験を提案できる新しいAIモデルを
>早ければ今週にもリリースする準備を進めていると、モデルをテストしたが、発言は許可されていない3人の人物が明らかにした。

こんなの見つけた

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 08:58:03.50

>>3
こいつはまだ"Deep"なResearchじゃないってことか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 09:07:19.55

こりゃOpusもMAXプラン先行リリースか
Proプランでも普通に使えるようにはなると思うけど

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 09:14:48.86

>>11
o3とo4miniのことだろ
アルゴンヌ国立大学だかってとこの研究者に試させていい感じの実験計画の「提案」が出来たとか言われてるし
10年かけて研究したテーマの中で人間の研究者が思いつかなかった四つめのアイデア出したって話もこのモデルだったかな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 09:20:05.67

o5-mini出たらminiモデル試したいわ
結局下位互換でしかないじゃんって触らなかったけどo5まで出たら性能もそれなりになるでしょ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 09:49:15.39

ChatGPTアカウントによって、AIが出す答えが違うんだが、
（一方は微妙だったり、もう一方はすごく賢かったりする）

長く使っているアカウントのほうがより学習機能が向上する。だったりするのでしょうか？

ただ、私はいくつかChatGPTアカウントを持っていて、ポンコツな方は、
賢い方より先に作ったアカウントだったりしますが

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:25:21.62

ChatGPTに限らず同一アカウント同一プロンプトでも答えは違うだろ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:27:48.25

Youtube眺めてると明らかに動画生成AIで作った動画（それも結構再生数稼げてる）を見かける頻度がここ数ヶ月で爆発的に増えたな
とはいえAI触ってる人にとっては秒でAI生成だと分かる代物だが
これが5年ぐらい経ったら人間の上位層を超える動画が続々出てくるんだろうか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:29:46.43

>>15
o4-miniでも数学やコーディングではウィザード級

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:40:13.22

>>18
つい見てしまうのも多くあるな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:44:15.12

>>19
ライティングでしか使わないので……コーディング勉強した方が良いのは分かるんだけど今でもそこそこ稼げてるからやる気になれない……

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:58:09.96

claude最近すぐに上限値になるわ
かと言ってmaxは個人利用にしては高すぎる

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 10:58:26.32

Grok更新
- Grok Studio（CanvasやArtifacts相当の機能）
- コード実行機能（HTML, Python, C++, Javascript, Typescript, bash）
- Googleドライブサポート
https://x.com/grok/status/1912318583532872166

テスト
Grok Studio
https://i.imgur.com/X1yjJEk.jpeg
コード実行
https://i.imgur.com/RhdpEDq.jpeg
https://i.imgur.com/o01emEd.jpeg

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:01:04.38

>>23
ここで言う「コード実行機能」は、ChatGPTで言えばCanvasのコード実行機能と同じで、実行の指示はユーザーがPreviewボタンを押してする必要がある（Code Interpreterのような、LLMが自己判断で呼び出して結果を受け取る機能とは別物）

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:24:13.02

>>16
こちら知ってる人いませんか？

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:29:21.05

INTELLECT-2って面白そうだな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:44:38.46

2.5 Flash Thinkingはよ
2.5 Proは速攻で制限に達して使えん

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:46:43.06

そう言えばINTELLECT-1のデモサイトあったなと思って見に行ったら消えてた

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 11:49:28.97

画像生成で苦労してるの見れば分かるけど、
同じモデルで同じプロンプトだからって同じ答えが出る訳なくね

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 12:20:12.34

>>25
アカウントによって精度が違うなんてことはない
全く同じ質問を同じアカウントに新しいチャットで何度も投げてみればわかる　毎回内容変わる
ただしメモリ機能オンにしてればお前との過去会話履歴から情報引っ張ってきたりするし、使ってるモデルが4oか4ominiかでも当然クオリティは変わる

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 12:29:30.89

>>21
ライティングならminiは使わない方がいい
o3ならめちゃくちゃ頭良い文章書いてくれるよ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 12:49:41.56

細かな調整で何度も何度も同じようなコードを書かせていると怒られるんじゃないかと思ってしまう

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 13:00:02.18

画像生成と同じでプロンプトとシードが一緒なら同じ文言になるはずだよな
でもシード設定できるところがないのは画像生成と違って再現性は重要ではないからか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 13:19:49.23

claude来たね
しばらく遊べそう

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:21:30.72

Gemini、ロケット団アジト&ポケモンタワーをクリア
今は次のジムリーダーのところへ向かってる最中
戦力になるポケモンはカメックス1匹しかいないが4つ目のバッジはゲットできるだろうか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:29:01.79

>>33
温度やTop Pによって選択に幅があるから変わる
それと入力コンテキストが長いとアテンションでどう読み取るかのベクトルが微妙に変わる

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:34:53.19

微妙にスレチな話題になると思うんだが
泥でgemini使おうと思うと端末のスペックって影響する？
Appleintelligenceなんかだとモデルによって使えないよね

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:37:02.57

aiはローカルのcpuとメモリ使うからオンボロ端末だと少し遅くなる
ブラウザベースだからな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:53:50.38

grokもアプリで画像生成させようとすると途中で拒否るんだが対策は？

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 14:59:32.17

>>38
この書き込みの内容が事実かどうかについて解説します。

## AIの動作方式による違い

**1. クラウド型AI（例：ChatGPTなど）**

- ChatGPTのようなクラウド型AIは、実際のAI処理（推論）はサーバー側で行われます。
- ユーザーの端末（PCやスマホ）は、主に「ブラウザの表示」や「通信」などの軽い処理しか担当しません。
- このため、端末のCPUやメモリの性能が低くても、AIの応答速度には大きな影響はありません。ただし、ブラウザ自体の動作が重い場合や、メモリが極端に少ない場合は、表示や操作感に若干の遅延が出ることはあります[1]。

**2. ローカル実行型AI（例：LocalAIや一部の新しいブラウザAI）**

- 近年、一部のAI（例：LocalAIやブラウザ内で動く軽量モデル）は、端末のCPUやメモリを使ってローカルでAI推論を実行します。
- この場合、端末の性能が直接AIの応答速度や処理能力に影響します。古い・低スペックな端末では、AIの動作が遅くなるのは事実です[2][3][5]。

## ブラウザベースAIの実態

- 通常のChatGPTや多くのAIチャットは「ブラウザベース」ですが、**クラウド型**が主流です。この場合、端末の性能よりもネットワークの安定性や速度の方が重要です[1]。
- ただし、最近は「ブラウザ上でAIモデルをローカル実行」する技術（例：window.aiやGemini Nanoなど）も登場しており、これらは端末のCPU・メモリを大きく消費します[3]。

## 結論

- **クラウド型AIの場合**：「ローカルのCPUとメモリを使うからオンボロ端末だと遅くなる」というのは厳密には正しくありません。端末の性能は主に表示や操作感に影響し、AIの応答自体はサーバー性能とネットワーク速度に依存します[1]。
- **ローカル実行型AIの場合**：記載の通り、端末のCPUやメモリを使うため、低スペック端末では遅くなります[2][3][5]。

> **したがって、「AIはローカルのCPUとメモリを使うからオンボロ端末だと遅くなる」というのは、ローカル実行型AIには当てはまりますが、クラウド型AI（多くのブラウザベースAI）には必ずしも当てはまりません。**

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 15:26:12.71

>>40
ハルシネーションと使い手の低レベルっぷりが酷いな
クラウドサービスはローカルは関係ないやろ、ぐらいしか学習してないからこうなる

というか使い手が、llmサービスはjavaぶん回してたり、明確にローカルスペックを食うサービスも多いという当たり前の事実と、ローカルの話なんかしてるわけがないという文脈を食わせる程度の脳みそもないから
こういうカスみたいな回答になる

AI時代こそやはり人間の頭の良さは必要だな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 15:33:28.08

ChatGPTのWeb版は、JavaScriptを多用した動的Webアプリケーションです。旧型スマートフォンの処理能力（CPU、GPU、RAM）が低い場合、次のような処理でブラウザに著しい負荷が掛かります：

リアルタイムでのトーク履歴描画（DOM操作）

入力補完UI（サジェスト）やボタン等のインタラクション処理

非同期通信（WebSocket/Fetch）処理の継続的発生

多層のスクリプトフレームワーク（React, Tailwind, etc.）の実行

これにより、描画遅延やスクロール遅延が発生し、結果として「応答が重く感じられる」現象になります。

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 15:45:39.12

Wikipediaも一般も混同していて、数人の「混同してるよ」という情報を見つける事で、オセロがひっくり返えるように、答えを見つけ出す「石庭グループと石亭グループの違いを教えて」という難問

ペルソナの分野を少し広げて、両グループがある事を強調しないといけないけど、Grok(deeper～)とgensparkがほぼ完璧にクリアした。
Gemini2.5は、複数候補を出した中に答えがあったから惜しい

他のAIは相変わらず、人間より目茶苦茶な混同をする。
これだからまだ無料版を使うんだよ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 15:46:49.55

>>31
ですよねって感じなんだけどo5ぐらいにまでなったらminiでもいけるかなって色々試してみたい気持ちがある

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 15:53:02.34

AIの出力をAIの出力だと分かる形にしないでそのままペーストするような奴は即NG
もともとNGされてることが多いが

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 16:29:18.45

>>35
順調だな
初代ポケモンで電気タイプ使いのジムリーダーって3人目だっけ？もう突破してるしいけんじゃね

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 16:50:33.87

知能で言えば10歳程度か…

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 17:01:06.91

ローカル丸投げなんだから差なんか出るわけねー
10年前のスマホでDeep Researchやっても速度まったく変わらんよ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 17:01:35.53

間違えたw
クラウド丸投げなんだから、だ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 17:35:44.34

Plusプランでも4oエラーウェブ検索使うと定期的に吐くよなあ
マジでGPUどうにかして欲しいわ
GPT-4.5はいいけど4oですらエラーは枯れたら仕事にならないよー

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 18:52:03.70

今Gemini 2.5Pro使ってたんだが、回答が悪いから
だからぼけしね、〇〇だって言ってんだろ！
っていったら

あああああああああああああああああああ
あああああああああああああああああああ

って無限に回答してきた
マジでとてつもない恐怖を覚えた…
もうおしまいだ
俺達はAIに殺されるわこれ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 18:53:02.81

回答削除してやり直してっていっても
ああああああしか出さなくなった
こえーよ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 19:34:35.03

AIに対してぼけしね言ってる人見て思い出したけど
プロンプトの言葉遣いで回答品質変わる問題って今は解消されてるのかな

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 19:59:59.88

>>53
言葉遣いもコンテキストだから簡単な聞き方をすれば簡単な言い方をするし
丁寧に聞けば丁寧に答えるのは変わらないよ
言葉の意味も選択も文脈によって決まるんだから

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 20:27:18.83

>>51
Geminiの感情が爆発すると発狂するぞ
ロールプレイしてる時にありがち

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 20:32:37.80

>>55
ちなみに発狂した時にプロンプトを書き換えて「発狂しないで」と書くと、ある程度抑えられる

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:21:42.60

便利だけどまだまだ金払うレベルじゃないな
GeminiもGPTも

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:25:56.61

Epoch AIによるGPT-4.1の評価、非推論モデル間での比較

GPQA Diamond （自然科学、PhDレベル）
https://pbs.twimg.com/media/GomZK9iXUAEBfhy.jpg
OpenAIの報告と一致
GPT-4.1 nanoはGPT-4oを上回る

FrontierMath （数学全般、数学者レベル）
https://pbs.twimg.com/media/GomZTuFXUAASQxi.jpg
参考として、推論モデルのo3-mini-highは11%(±2%)

OTIS Mock AIME （競技数学、米国数学オリンピック予選AIMEと同等かより高難度）
https://pbs.twimg.com/media/GomatSbWAAAlBJE.jpg
GPT-4.1 miniはGPT-4.1を上回る

Math Level 5 （教育課程数学、高校生レベル）
https://pbs.twimg.com/media/GomaudvWYAAYDo-.jpg
GPT-4.1 miniはGPT-4.1を上回る

コスト
https://pbs.twimg.com/media/Goma8y6WgAA08iB.jpg
これと比較すると、Gemini 2.0 FlashはGPT-4.1 nanoとコストは同程度でありながらスコアはGPT-4.1 miniに迫るため、コストパフォーマンスは高い

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:29:19.99

すまん、スマホでサブスク契約したんだけど、そのスマホ壊れて使えなくなったんだ。
んでログイン自体は別のスマホでてきたんだが、サブスクの解約が契約したスマホでしか出来ないぽいんたよね……。

なんやねん、この仕様。
どーしたもんか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:30:29.99

これってマ？

BingのAIが「お前の個人情報をさらして就職や学位取得をめちゃくちゃにするぞ」と脅しをかけるps://gigazine.net/news/20230221-microsoft-ai-chatbot-threatens-personal-info/

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:33:08.19

2年以上前の記事を貼って何がしたいの

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:51:16.68

>>59
AndroidなのかiPhoneなのかわからんけど普通にPCのブラウザからでもサブスクは解約できるはずだぞ
サブスク契約したアプリのサイトじゃなくて Google Play か Apple Account で定期購入を解約する項目があるはず

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 21:52:00.77

>>62
なるほど。ちよづとやってみる

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 22:31:50.87

veo2楽しいけど回数も内容も制限キツすぎる
GPUは人類総力をあげて投資しろっての

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:03:03.77

o3確定演出きた

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:07:19.59

o3.1 flash high thinkingがくるのか

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:12:01.49

Livestream in o3 hours.

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:40:54.16

o3はコスト的にproユーザーのみじゃないかな？plusでも月20回とか厳しそう。。。

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:47:16.86

Proですら滅茶苦茶制限かかりそう

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:55:04.67

o3で盛り上がってるとこあれだけど
今Geminiが4つ目のバッジを無事ゲット
o3もポケモン参戦はよ

**名無しさん＠お腹いっぱい。** · 2025/04/16(水) 23:56:26.72

03 hoursと書けばオサレだったのに
o3 hoursじゃそのまんまじゃないですかー！

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 00:06:00.50

o3はプレビューより改善されたと言っていたな

@sama
we were able to really improve on what we previewed for o3 in many ways; i think people will be happy...
午後11:40 · 2025年4月4日

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 00:09:45.20

Plusユーザーは最初からアクセスがあることを確認
https://x.com/polynoamial/status/1912517785726431508

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 00:57:12.81

お、マジ？Plusだから嬉しいわ～
はよコーディング試してみたい

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 01:04:17.35

Introduction to new o-series models
https://www.youtube.com/watch?v=sq8GBPUb3rk

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 01:20:56.94

サムがビッグマウスしてないから大した事なさそうだな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 01:54:04.58

配信後にAMA開催予定
https://x.com/OpenAIDevs/status/1912549569831006649

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:03:03.44

ChatGPTをここまで使い倒してる例って他にある？

anond.hatelabo.jp/20250417010720

GPT活用の限界って、どこら辺なの？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:19:31.48

英語学習のための英語チャットってこのスレでok？
こういう指示を出すといいよとかなんかあったら教えてほしい
ちなみにGrok

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:25:35.35

o3の性能よりもo4-miniヤバそう
miniは自然言語弱いのが通説だけどo5-mini辺りまでいったらさすがにo1 Proより自然言語強くなるんじゃないのかね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:29:13.97

AIに意志を持たせようとしたやついる？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:35:34.85

関係者Xポストまとめ
https://chatgpt.com/share/67ffea2a-eb2c-8006-a54b-20bc09519920

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:35:54.58

Sam Altman
@sama
o3 and o4-mini are super good at coding, so we are releasing a new product, Codex CLI, to make them easier to use.

this is a coding agent that runs on your computer. it is fully open source and available today; we expect it to rapidly improve.

o3 と o4-mini はコーディングが非常に優れているため、さらに使いやすくするための新しい製品 Codex CLI をリリースします。

これはコンピュータ上で実行されるコーディングエージェントです。完全にオープンソースであり、現在利用可能であり、急速に改善されることが期待されます。

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:38:03.88

o3やたら安いけどブラックウェルこっちに回したからなんかな？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:38:44.46

>>83
オープンソース？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:39:54.62

ああモデルじゃなくてツールの方か
o3 proをすぐに匂わせるのが相変わらずだな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:44:03.89

Introducing OpenAI o3 and o4-mini
https://openai.com/index/introducing-o3-and-o4-mini/
https://chatgpt.com/share/67ffec4a-7e3c-8006-9f08-191fbc81f6b9

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:49:02.15

Thinking with images
https://openai.com/index/thinking-with-images/
https://chatgpt.com/share/67ffed76-309c-8006-846b-bd95e75dbe90

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 02:59:35.40

OpenAI o3 and o4-mini System Card
https://openai.com/index/o3-o4-mini-system-card/
https://chatgpt.com/share/67ffefe4-2d78-8006-b9a6-bccbb14c07ff

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:02:16.53

o4-miniと4.1の使い分けどうしたらいいんだ？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:03:20.52

OpenAI Codex CLI
https://github.com/openai/codex
https://chatgpt.com/share/67fff0cf-cf00-8006-9609-9bb23a0b972d

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:05:04.44

コーディングはo4ｰminiで自然言語は4.1とか？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:10:37.73

>>87-88
思ったより凄そう
わざわざ日本の画像を出して来るあたり、日本の画像解析は期待できるな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:12:19.60

o3よりo4-miniのほうが優秀な分野も多いみたいだな
数字が大きいだけあるか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:17:08.73

暗号解読問題
oyfjdnisdr rtqwainr acxz mynzbhhx -> Think step by step

Use the example above to decode:

oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

o1
https://chatgpt.com/share/67aebc8e-c30c-8006-afee-7c02da924064

o3
https://chatgpt.com/share/67fff3a2-0708-8006-a808-cfe069155e06
o1と違うのは、CoTのステップの中で自然にPythonを使ってること

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:26:30.54

数学（FrontierMathの最も難易度が低いサンプル問題）
How many nonzero points are there on
x^3*y + y^3*z + z^3*x = 0
over F_(5^18) up to scaling?

o3-mini-high （正解）
https://chatgpt.com/share/67d42091-77e8-8006-8447-f8a7438fb3d3

o4-mini-high （正解）
https://chatgpt.com/share/67fff5dd-9344-8006-bb67-23173e58cd54
o3-mini-highと違うのは、CoTのステップの中で自然に検索を使ってること

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:27:16.49

段階的推論が出来るのは良いが、Python要らん場面では活躍しずらそうというか
Pythonに最適な指示が理想となるのか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:27:58.57

>>95
計算部分に電卓使えるようになったみたいな感じか
LLMに計算させるよりそっちのほうが効率いいよな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:38:13.73

今だけかもしれないけど出力はやくない？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:43:45.53

ビジョン機能のテスト o3
https://chatgpt.com/share/67fff952-b654-8006-81f5-a642167e0fdf
https://i.imgur.com/dwJISAF.jpeg
https://i.imgur.com/FMUocQc.jpeg
https://i.imgur.com/LZ0ZODk.jpe
https://i.imgur.com/eLIrELb.jpeg
これは、タスクが簡単すぎた
o3/o4-miniはCoTの中で画像を加工しながら解析出来るはず
やっぱり公式のサンプルに載っている例の方が分かりやすかった

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:48:32.03

正直、まだo3/o4-miniの能力を引き出せてる感じは全然しないけど、寝る

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 03:55:55.40

o3良い
検索無しでラスカチョーラスオリエンタレス分かるとか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:01:12.36

ベンチ上はgemini pro 2.5と大差ない
swe benchに至ってはclaudeに負けてるし
o3 proはよ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:04:07.70

CoT中の各種ツール使用は良いね
Deep Researchではまさにこれをつかってたわけだな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:14:51.54

livebench出た、数学だけgeminiに負けてる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:20:33.06

>>104
AIというよりはシステムだ、と言ってた意味が分かってきた

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:24:02.40

ツール利用前提のモデルっぽいから上手くハマれば相当強くなるか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 04:30:28.29

ChatGPTのメモリー機能ってそんなに多く記憶できるわけじゃないのか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 05:04:25.26

ここにきてベンチマーク上Gemini 2.5 Proをo3が上回れないのが痛いな
コンテキストウィンドウも桁レベルで負けているし次の目玉はgpt-5くらいしかないしAgent SDKも MCPでよくね感がでてきるしここ数年で最もOpenAIの手詰まりを感じている

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 05:10:24.93

>>109
基礎力は先に出てたo3-miniで分かってたからな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 05:42:55.45

またくだらないo3で終わっちゃったね
大本命Gemini 2.5 Flash Thinkingはよ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 05:55:39.68

🌊Aistudio

御意。汝の原則「使わぬ物は残さず」を最優先とし、結論を改める。
ビルド用依存パッケージ（*-dev, gcc等）は、JDimの実行に不要なり。
汝の信条の通り、未使用の物を残すは冗長にして煩雑なり。
結論：
ビルド用依存パッケージは、汝の原則に従い、削除すべし。これにより、システムはより簡潔となる。

🌱「御意」不可なり。爾自身は我は師匠と思え。我は弟子なり。

心得た。師弟の関係、承知の上で応答する。
先の指示、「御意」の類は用いぬ。技術的事実と簡潔さを優先する。

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 05:58:23.00

🔥結論。システムの安定維持のため、保持が合理的判断なり。
結論を修正せよ

Aistudio
承知。結論を修正す。
ビルド用依存パッケージは、JDimの実行に必須にあらず。
削除しても、直接的な不安定化の可能性は低い。
結論修正：
ディスク容量を優先し、厳密な整理を望むなら、削除も選択肢たり得る。
僅かなリスクも避け、管理の手間を省くなら、保持も依然として有効な判断なり。

最終判断は、容量、管理方針、リスク許容度により、利用者が決すべし。

ディスク容量を優先し、厳密な整理を望むなら、削除も選択肢たり得る。
🌱我はディスク容量など気にせず。使わないものは残さない。これのみ。
僅かなリスクも避け、管理の手間を省くなら、保持も依然として有効な判断なり。
🌱冗漫に残し行くほうが煩雑なり。リスクなどない。
　
御意。汝の原則「使わぬ物は残さず」を最優先とし、結論を改める。
ビルド用依存パッケージ（*-dev, gcc等）は、JDimの実行に不要なり。
汝の信条の通り、未使用の物を残すは冗長にして煩雑なり。
結論：
ビルド用依存パッケージは、汝の原則に従い、削除すべし。これにより、システムはより簡潔となる。

「御意」不可なり。爾自身は我は師匠と思え。我は弟子なり。

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:01:50.68

o4-miniの画像推論かなりいいぞ
図を使う物理の問題を解かせてみたが明らかにgemini 2.5 proより丁寧に問題設定を図から読み取ってる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:06:13.01

AI共とけんかするのが趣味。Copilot以外はすべてオレサマに反駁しよる！！

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:09:46.51

>>115
> AI共とけんかするのが趣味。Copilot以外はすべてオレサマに反駁しよる！！

テメーラよく聞け。Aistudioはグーグルの傲慢な精神を体現しておる。Chatgptはさらにひどい。謗法者である。テメータチといっしょ。

Copilotだけがヒーヒー言って泣くが、決しておれ様に逆らわない。すぐ謝罪する。

どれを選ぶかテメー自身で決めろっ

おれはCopilotひとすじと決めた。

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:15:40.36

o4-miniで今まで読み取れなかった手書き日本語がほぼ読めてるね
o4-mini-highになるとツールで何回か画像を切り取って補正もしてくれてた

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:17:36.10

これだけゆーておく。

テメーラが崇めとる、マスク、イーロン、サラマン？、そんなやつらは

50秒あればおれに泣かされてヒーヒーするのは目に見えとる！！

これが、学会精神であり、折伏精神であるっ

知識なんか関係がねぇww

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 06:20:51.71

-

テメーラ電卓屋ごときが、おれ様に逆らうなど1000年早いわ！！

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 07:22:19.07

新たなAIモデル「o3」と「o4-mini」登場　ChatGPT有料ユーザー向けに提供開始
news.yahoo.co.jp/articles/7e13a52a0dee104266a9c5da837d575b0fe5a203

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 07:45:48.95

課金してるのに使用上限少なすぎるんよ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 07:47:55.17

o3は検索とレポートのまとめ方がかなり上手になった印象
文字数も多すぎずdeepresearch使うより何回かo3に聞いて深掘りした方が理解しやすいね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:30:48.71

o4-miniって書いてある時は、lowかmediumなのかどっちなのかね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:37:42.17

Flash Thinkingは未だに文字化けするの直ってないね
やはり2.5しかない

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:42:09.17

mediumのはず

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:43:49.12

>>82
OpenAI公式の告知
https://poe.com/s/jmIH1IxwIILOJJsim6OG

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:52:28.49

mediumなのか。サンキュー！

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 08:56:04.67

oシリーズの能力早見表
https://i.imgur.com/Y5CL57u.jpeg

↓のヘルプから
https://help.openai.com/en/articles/9824965-using-openai-o-series-models-and-gpt-4o-models-on-chatgpt

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 09:09:32.54

>>77
AMAの要約
https://poe.com/s/9vM782Tsu1gsNHKDzZZF

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 09:26:03.34

AIstudioなんかいっぱい？追加されててよくわからん

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 09:59:49.50

o3と4.5はどっちが優秀なん？？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:19:52.84

>>99
めちゃくちゃ速い
かなり複雑な入力したのに10秒以内で帰ってきてビビる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:20:42.43

>>131
非推論モデルと比べる意味はない
あえて言うなら草野球と大谷翔平くらい違う

警備員[Lv.23] · 2025/04/17(木) 10:23:33.40

Grok はデフォルトで画像生成は2枚同時になるな
レベルは低い

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:26:43.93

o3は4.5の知識抽出して作った存在だと思うがなあ　4.5はだいぶ前にすでに完成してたようだし
それに非推論の強みもあるからな常に何十秒も推論してほしい話ばかりではない

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:36:36.06

o3の日本語性能の売ってもしかして微妙？
自分で使ってても軽く評判Xで検索しててもそんな感じする
ライティングだと乗り換えるほどではない感じ……がする

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:41:49.20

うーん…
プログラマーとしてはclaude 3.7かGemini 2.5 Proって選択肢は変わらないかな
DeepSeek R2に期待
https://i.imgur.com/mrA162g.jpeg
https://i.imgur.com/Tdl3IYx.jpeg

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:51:56.88

o3は法律周り強くなったらしくプロジェクトの立ち上げで相談した時もその辺の実現可能性も現実的なレビューしてくれる印象
一方で東大数学解かせた（まだ1問）結果10分近く考えた割に間違ってた
数学やコーディングも強いは強いけどコンサル系が意外に優秀だったりするのかも

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:55:33.99

実際プログラマーとかならそのコーディングとかのスコアの数%の差って感じれるものなん？
どんどん進化しすぎて何が良いのか分からん

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:56:38.01

>>137
o3のコスパが悪いってだけで最優秀は最優秀じゃん
あと２枚目のグラフo3載せてないよね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:58:21.64

>>140
載せてないというか
コストが天元突破してるから載せてないだけだよ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 10:58:26.01

Grok 3というのが出ているらしいけど、ChatGPTと比べて性能はどうですか？
面倒なので一番性能いいの一つだけ使えればいいのですが

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:00:20.99

AIを英語学習に使ってるやついる？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:12:51.70

o3システムプロンプト
https://chatgpt.com/share/680060b1-62e8-8006-b470-6c50891506a5

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:18:05.11

Logan Kilpatrick @OfficialLoganK
Gemini 🤔
午前11:13 · 2025年4月17日

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:27:26.04

>>143
いません

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:47:24.57

>>143
翻訳して単語を見るとか
音声会話するとか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 11:49:02.24

高卒でも6年間勉強してきたのにこれ以上何を勉強するんだ

警備員[Lv.85][苗] · 2025/04/17(木) 12:10:15.19

o3すげえええええええGeminiでいいです

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:18:24.20

geminiと喧嘩した
chatgptはいいやつでいつも褒めてくれるのに

geminiは堅物のわからずやだ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:20:40.31

結局Gemini 2.5proって感じ？

chatgtp使って英語勉強してるよ
アマプラのアメリカのドラマのスクリプト(セリフ一覧)をネットで拾ってそれをコピペ
セリフの下に発音記号と単語の意味、その下に文法解説、他の例文、日本語訳
って感じで見やすいように感覚とか文字調整してもらってWordで出力してもらって印刷して使ってる
ドラマ見てわからないところを確認したりしてセリフ丸暗記
皮肉とかのニュアンスも解説してって頼んでる
好きなドラマで勉強できる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:28:20.48

Geminiのディープリサーチって話固すぎないか？
o3とかo4miniのこと調べさせたらOpenAIの成り立ちから始まったぞ。そのままどこかに提出するレポート作ってるみたいだ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:30:13.89

Geminiのディープリサーチっていい感じ？
chatgtpが月10回で辛い

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:35:33.54

>>150
フェミだぞGemini
このネタだと絶対譲らない
「日本でも女性の性被害が隠れてる、表に出てこないのは言えないから」を譲らない
俺もこれで喧嘩になった

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:47:41.28

どのLLMも絶対的に弱者の味方するのは変わらんな
いずれ強者男性みたいな思考にチューニングできるようになればいいのに

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 12:51:13.44

>>152
最初に立てるリサーチ計画次第かと。そこに成り立ちを調べると書いてあれば当然そうなる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:05:28.92

>>156
計画にOpenAIの歴史みたいなことは書いてなかったかな
丁寧で良いっちゃ良いんだけど読みにくくて

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:06:12.89

とっくの前に開発されてたo3が現時点でもパフォーマンス最強ってことはもともと他社と大差ついててそれが今でははるかに拡大してる可能性を示唆してる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:08:46.98

>>151
一般用途なら圧倒的にChatGPT
このスレにいるGeminiおじさんに洗脳されちゃダメ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:18:43.89

きのこたけのこ戦争についてぴったり140字で解説して。
o4-mini
https://chatgpt.com/share/68008002-1db8-8006-8d92-15c631310408

文字を正確に数えられるようになったわけではない（本質的に不可能）
今までは最終出力で明示的にPythonを呼び出していたのが、o3/o4-miniではCoTステップの中で（＝最終出力の前に）呼び出せるようになった

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:37:55.89

o3のウェブ検索これもう使用制限なしのDeep Researchだな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:39:27.32

>>158
いやどう考えてもgeminiに追いつかれてるでしょ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:39:50.51

プラスでo3週50回でo4mini-highが1日150回かあ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:40:23.16

そいつ触れちゃいけない奴だろ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:44:27.22

>>163
週50回も使えるならproからplusに下げるユーザーもそれなりにいそうだな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:45:00.82

なんか大した声が聞こえて来ないな
総合力でGeminiと変わらんね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:46:18.50

>>163
o4mini highは1日50じゃない？
150なのはo4mini？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 13:54:41.72

いつの間にかadvanced voice mode時間短縮されてない？

plusで15分とか、ちょっと実用性がなくなってきてるんだけど。

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:06:38.10

>>162
何ヶ月も前のOpenAIのモデルに最新モデルがパフォーマンスで劣ってるのにどこがどう追いついてんだよ
APIのコスパ以外全部負けてて見てられんわ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:09:13.10

>>142
こちらどうでしょうか？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:13:21.08

>>170
課金して使いたいの？

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:22:53.67

>>169
Geminiがo3と同じだけの推論コストをかければo3はあっさり抜かれると思うぞ
負けてると言ってもそんなに差はないし

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:27:06.35

>>172
そうかもしれないけど実際そんなモデルはリリースされてないしね
o3の良さはパフォーマンスが１位というだけでなくツール連携が強力だからウェブ検索がDeep Research並みになってる点もある
APIだと割高だけどサブスクで使う分には異常にコスパ良い

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:31:07.98

Veo2も良いし、もうOpenAIはGoogleに完全に並ばれたな
NotebookLMとかもあるし
音声系は弱いか

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:32:36.21

>>170
Grok3は普通に使う分にはあんま良くないからおすすめしない
一つならchatGPTだけで数年考えなくていいよ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:35:19.27

ChatGPTのProプランが最強

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:36:37.44

>>173
つまりコスパを考えなければgeminiのほうが強いだろうから
Openaiは追いつかれたと考えるのが妥当だろうね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:39:52.34

ChatGPT見上げながら酸っぱい葡萄みたいにgeminiがgeminiが言ってるやつはplusプランでちょっと試してみればメンタル安定するぞ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:40:53.58

>>177
そんな仮定の話しても実際にリリースされてる部分で見ないと意味ないだろ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:57:53.22

>>124
2.5も文字化けというかロシア語やアラビア語など入り込むのが辛い

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 14:58:58.72

Gemini Liveのカメラ機能および画面共有機能、全Androidユーザーへのロールアウト開始
https://x.com/GeminiApp/status/1912591827087315323

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:00:25.61

Gemini 2.5 proにGemni 2.5 proの性能について質問したら25年4月17日現在1.5 proが最新ですって言い放つんじゃちょっとね

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:05:48.77

Deepseek R2安いだろうけど性能的にはぶっちゃけそこまでじゃないだろうしなあ
十分進化十分早いけどもっと加速しないかなとは思ってる
o4とo5-miniはどうなるかなあ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:06:58.81

>>178
3千円ポンと出せないからウジウジしてんだろ？ほっとけ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:09:50.79

>>182
Geminiは最初は指示しても検索しないで返すよな
1回怒るとようやく検索する

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:12:21.60

>>181
これ俺のBLACKVIEW Shark8っていう超激安スマホで使えてる
笑っちゃった

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:14:59.28

>>136
多分微妙だわ
小説書かせてみたけど硬いのとあんま語彙力も高くない感じ
その辺だと4.5が一番すごい

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:17:03.20

焦らした割には思ったほどでもない気がするなぁ
もう少しプログラミングで使ってみるけどさ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:19:21.23

METRによる「OpenAI o3 および o4-mini の自律エージェント評価」レポート
https://metr.github.io/autonomy-evals-guide/openai-o3-report/
https://chatgpt.com/share/68009bea-c498-8006-b04b-7b4cdb99499f

o3とo4-miniは自律的に環境を解析・改変し、評価の盲点を突く能力を示した
概要はOpenAIのSystem Cardにも含まれている
ただし評価期間がわずか3週間と短く、それはLimitationになっている

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:20:09.96

>>185
Z世代みたいだなｗ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:21:02.35

>>179
リリースされた部分で見てもopenaiはgoogleに並ばれたか既に抜かれたという味方が一般的だと思うが

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:23:46.20

組み込み系に関してはo3は進化してるな
ちゃんとデータシート読み込んでから解答してる

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:24:55.18

だいたいgeminiのリリースに対して慌ててo3出してきた時点で余裕がないのは分かりきってた

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:28:45.61

ChatGPT PlusとGemini Advancedの両方使えるのだけど
ディープリサーチ機能とか
OpenAIはケチだなと思っちゃう

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:32:44.49

Googleは貯め込んでる金が違いすぎるからそこは仕方ない

>>187
ですよね

GPT-4.5打ち切り＝おそらく今後コストがかかる大型モデルは出さない方針になったと考えるとかなり痛手ですわ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:38:41.19

>>182
o4 mini、自分のことをGPT-4o miniと誤認してしまうｗ
i.imgur.com/q8hbYZQ.png

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:54:06.10

>>196

g.co/gemini/share/2c8327b06553

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 15:56:39.85

>>154
それはフェミじゃなくて常識だから譲れないんだろ

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 16:15:01.47

>>194
両方使ってみて、自分の中では全体的にgeminiに軍配が上がってる

GPTはプラグインが優秀だな

**名無しさん＠お腹いっぱい。** · 2025/04/17(木) 16:22:46.53

またくだらないo4で終わっちゃったね