!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください
各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。
- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/
前スレ:
【ChatGPT】AIチャット総合 32【DeepSeek・Gemini】
https://mevius.5ch.net/test/read.cgi/esite/1739157244/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
探検
【ChatGPT】AIチャット総合 33【DeepSeek・Gemini】
レス数が1000を超えています。これ以上書き込みはできません。
1名無しさん@お腹いっぱい。
2025/02/18(火) 18:44:39.88ID:RM76pScp2名無しさん@お腹いっぱい。
2025/02/18(火) 18:45:50.59ID:RM76pScp AIチャット総合スレッドテンプレ
https://poe.com/s/w867y1gSp3f91hezOjto
https://poe.com/s/w867y1gSp3f91hezOjto
3名無しさん@お腹いっぱい。
2025/02/18(火) 19:24:46.75ID:RnSaSjaq grok 3のオープンソース公開はいつ?
2025/02/18(火) 19:33:46.01ID:lITndnL1
asset.watch.impress.co.jp/img/pcw/docs/1663/782/06_o.jpg
スクショ見たらなんかDeepSearchとThinkとBig Brainとかいうのもあるの?
しゅごいね!
スクショ見たらなんかDeepSearchとThinkとBig Brainとかいうのもあるの?
しゅごいね!
5名無しさん@お腹いっぱい。
2025/02/18(火) 19:38:48.24ID:rpOLzGaY Meta AIはほんといつ日本に来るのか分からんな
2025/02/18(火) 19:34:01.61 ID:ID1hUXVm
メタもLlamaを「Meta AI」としてフェイスブックやインスタグラムに統合してるんだね?
日本では使えないみたいだけど
2025/02/18(火) 19:34:01.61 ID:ID1hUXVm
メタもLlamaを「Meta AI」としてフェイスブックやインスタグラムに統合してるんだね?
日本では使えないみたいだけど
6名無しさん@お腹いっぱい。
2025/02/18(火) 19:39:08.77ID:rpOLzGaY >>3
Grok4が出たあと
Grok4が出たあと
2025/02/18(火) 19:42:02.53ID:ID1hUXVm
Grok3使える人、プロンプト「日本語でSF小説を書いて」で書かれたものを貼ってくれないか?
書かれた小説の場面が変わって、その場面のつながりが自然なら、長文も学習に使っていると判断するわ
Grok2はXの短文のみで学習しているのか、小説の場面転換が変だった
書かれた小説の場面が変わって、その場面のつながりが自然なら、長文も学習に使っていると判断するわ
Grok2はXの短文のみで学習しているのか、小説の場面転換が変だった
2025/02/18(火) 19:42:17.32ID:K/8uSiFE
課金したのにDeepSearch出てこないんだが。
9名無しさん@お腹いっぱい。
2025/02/18(火) 19:48:23.51ID:e/2m5mxN2025/02/18(火) 19:55:13.22ID:MgsM5FiR
AIの出力貼るやつはAIに短くまとめてもらってから貼れよ
2025/02/18(火) 19:55:29.01ID:lITndnL1
参考
OpenAIの推論AI「o1」、MicrosoftのCopilot経由で無料で利用可能に
www.itmedia.co.jp/aiplus/articles/2501/31/news139.html
GoogleがGemini 2.0を誰でも使えるように公開、新たに低コスト版や高機能版、検索機能付属版も登場
gigazine.net/news/20250206-gemini-2-0-model-update/
OpenAIの推論AI「o1」、MicrosoftのCopilot経由で無料で利用可能に
www.itmedia.co.jp/aiplus/articles/2501/31/news139.html
GoogleがGemini 2.0を誰でも使えるように公開、新たに低コスト版や高機能版、検索機能付属版も登場
gigazine.net/news/20250206-gemini-2-0-model-update/
2025/02/18(火) 19:56:48.11ID:pbom86hB
chatgptで音声会話モード使ってると、たまに何も言ってないのに『ご視聴ありがとうございました』と認識されることがある
1週間に2回くらいなってる気がする
1週間に2回くらいなってる気がする
2025/02/18(火) 19:57:23.03ID:pbom86hB
日本語の音声をYouTube使ってラーニングしてるのだろうか
15名無しさん@お腹いっぱい。
2025/02/18(火) 20:03:51.13ID:OMBx+zGi Deep Research系のネーミング各社で被りすぎてどれ指してんだか分かりにくいな
今いくつあるよ
今いくつあるよ
2025/02/18(火) 20:08:14.50ID:DHwLW1zK
Grok3のDeep Searchは、
ChatGPTのDeep Researchとは被りたくない
BingのDeep Searchなら被っても問題無し
という判断だな
ChatGPTのDeep Researchとは被りたくない
BingのDeep Searchなら被っても問題無し
という判断だな
2025/02/18(火) 20:24:28.16ID:lITndnL1
DeepSeekが無料でR1出したら他社も無料で出すのすごいな
R1出さなきゃこうはならなかった
R1出さなきゃこうはならなかった
18名無しさん@お腹いっぱい。
2025/02/18(火) 20:27:13.25ID:RnSaSjaq chatgptのフィルター緩くなったけどAVの話題はまだダメだわ
タイトルとか女優名で検索させたいのに
タイトルとか女優名で検索させたいのに
2025/02/18(火) 20:28:38.14ID:8f5uIHfq
まじでo1proレベルなの?
それなら課金するけどなんかベンチマークに比較が載ってなくね
それなら課金するけどなんかベンチマークに比較が載ってなくね
2025/02/18(火) 20:33:06.17ID:X51XLnvO
2025/02/18(火) 20:35:15.44ID:/WZgM3g0
Grok3の発表を受けて動画上げる日本人が一人もいないの終わってんな
2025/02/18(火) 20:48:02.80ID:m/JlLSl5
Xのプレミアムプランが、Webからは2590円で、AndroidのXアプリは8190円だな
2025/02/18(火) 20:48:53.52ID:m/JlLSl5
Xプレミアムプラスの間違い
24名無しさん@お腹いっぱい。
2025/02/18(火) 20:51:58.11ID:wr02jwsZ o3 mini highレベルが十分の位置の価格で使えるようになったわけで
o3 pro出さないとopenaiはボロ負けだな
サム頼んだぞ
o3 pro出さないとopenaiはボロ負けだな
サム頼んだぞ
25名無しさん@お腹いっぱい。
2025/02/18(火) 20:59:12.78ID:fRzTStHi なーにこの後来るGPT4.5とGPT5が全てを消し炭にする
アルトマンは1人ほくそ笑んでいる
アルトマンは1人ほくそ笑んでいる
2025/02/18(火) 21:02:23.13ID:Cgjsih1U
OpenAIのproプランはDeep Researchだけでも存在価値あるよ
これからはモデルの単純なスペックだけでなくエージェントの使い勝手が大事になると思う
これからはモデルの単純なスペックだけでなくエージェントの使い勝手が大事になると思う
2025/02/18(火) 21:03:42.81ID:EpLA1aab
GPT-5はともかくGPT-4.5はClaude4とどっこいどっこいって感じだと思うな
自然言語とかは特に
自然言語とかは特に
2025/02/18(火) 21:04:04.82ID:lITndnL1
>>21
R1出た時は毎日スレが立って伸びまくっててやばかったな
R1出た時は毎日スレが立って伸びまくっててやばかったな
2025/02/18(火) 21:04:13.63ID:Cgjsih1U
推論が入ってない4.5にはそこまで期待してないけど5はOpenAIの集大成になりそうで期待大
もちろん各種エージェントは言うまでもない
もちろん各種エージェントは言うまでもない
2025/02/18(火) 21:08:49.26ID:rLYa5Oo8
Claude使ってるやついる?
Sonnet 3.5の性能下がってる気がするのだが、気のせいかな。
Sonnet 3.5の性能下がってる気がするのだが、気のせいかな。
31名無しさん@お腹いっぱい。
2025/02/18(火) 21:58:58.09ID:Jl0xGbJp 推論なしで20件ぐらい検索して出してくれるのGrok3強すぎる
もしかしてOpenAIって型落ちしか作れないのか?
もしかしてOpenAIって型落ちしか作れないのか?
2025/02/18(火) 22:04:17.71ID:lITndnL1
何十件もソース持って来られても確認してられないから数件だけ引っ張ってくるFlash Thinkingが丁度良い
33名無しさん@お腹いっぱい。
2025/02/18(火) 22:09:42.76ID:RpIUc8Jt grok、ChatGPT、gemini、claude、copilot
アメリカだけでこんなに乱立するくらいなら
ビッグテック共同で従業員一つのAIに絞って開発投資した方がとんでもないもの作れるんじゃないの
アメリカだけでこんなに乱立するくらいなら
ビッグテック共同で従業員一つのAIに絞って開発投資した方がとんでもないもの作れるんじゃないの
35名無しさん@お腹いっぱい。
2025/02/18(火) 22:17:55.22ID:Jl0xGbJp 俺の5080はGTA6とモンハンで使うからみんな分けてあげてくれ
2025/02/18(火) 22:18:03.14ID:m/JlLSl5
日本人て資本主義国のくせに、中国より共産主義的な考え方するよね
各社が競争するから良いものが出てくるのに
GPUがエヌビディア独占で高値止まりしているのを目の当たりにしながら、何を見てるのって?
各社が競争するから良いものが出てくるのに
GPUがエヌビディア独占で高値止まりしているのを目の当たりにしながら、何を見てるのって?
2025/02/18(火) 22:18:36.77ID:/WZgM3g0
競争するから今の進化があるのだよ
2025/02/18(火) 22:20:22.56ID:m/JlLSl5
もう一つ、GPUがエヌビディア独占だから数が足りなくなってるのに、というのも追加
ただ、これは世界的な半導体不足も絡むか
ただ、これは世界的な半導体不足も絡むか
39名無しさん@お腹いっぱい。
2025/02/18(火) 22:22:08.77ID:Jl0xGbJp 競争せず慢心したのが今のOpenAI
2025/02/18(火) 22:23:34.07ID:lITndnL1
それ証明したのR1だからな
GPT-3.5以来の衝撃だよあれは
GPT-3.5以来の衝撃だよあれは
2025/02/18(火) 22:23:38.72ID:AxO+NSWu
>>39
grokのどのあたりがOpenAIより良いの?
grokのどのあたりがOpenAIより良いの?
42名無しさん@お腹いっぱい。
2025/02/18(火) 22:24:17.93ID:dKnnaMBx 日本はエンジニア少ないから分散して競争のような事しても
低品質なAIしか作れてないけどな
低品質なAIしか作れてないけどな
43名無しさん@お腹いっぱい。
2025/02/18(火) 22:34:30.52ID:wr02jwsZ 日本はほとんどクローズドだから競争しようという気がないしする金もない
44名無しさん@お腹いっぱい。
2025/02/18(火) 22:47:38.45ID:RnSaSjaq xで検索しても実際にgrok 3使ってる人めちゃくちゃ少ねえな
AI驚き屋も含めてすげー言ってる人達皆ベンチマークの貼ってすげーって言ってるだけ
やっぱ皆xに金払いたくないんだな
AI驚き屋も含めてすげー言ってる人達皆ベンチマークの貼ってすげーって言ってるだけ
やっぱ皆xに金払いたくないんだな
2025/02/18(火) 22:50:11.60ID:fJJuWlbQ
>>43
NTTとかNECがAI作ってるらしいけど何も情報無いから存在しないのと一緒だな
NTTとかNECがAI作ってるらしいけど何も情報無いから存在しないのと一緒だな
46名無しさん@お腹いっぱい。
2025/02/18(火) 22:50:46.18ID:Jl0xGbJp >>41
非推論なのにo3より良い結果出してくれる
非推論なのにo3より良い結果出してくれる
2025/02/18(火) 22:55:55.54ID:yds5QHMU
日帰り旅行の詳細のスケジュール頼んだんだけど作れるんかな?
作れるとは言ってるけど
どこかで、言葉面は良いこと言うけど結局できないことがあるみたいなの見たから心配
詳細って、交通機関のダイヤや移動時間含めたタイムスケジュールなんだけど
使ってるのは白地にドーナツマークのアプリ(無料版)
アップグレードしなくても作れるとも言ってた
作れるとは言ってるけど
どこかで、言葉面は良いこと言うけど結局できないことがあるみたいなの見たから心配
詳細って、交通機関のダイヤや移動時間含めたタイムスケジュールなんだけど
使ってるのは白地にドーナツマークのアプリ(無料版)
アップグレードしなくても作れるとも言ってた
2025/02/18(火) 22:56:25.36ID:WKbQ/tIN
2025/02/18(火) 22:57:42.45ID:yds5QHMU
あ、OpenAIみたいです
50名無しさん@お腹いっぱい。
2025/02/18(火) 22:58:09.40ID:5w6l7R2V >>30
隙あらばHaikuになるし、Sonnetだったとしても限りなくHaikuな感じ
隙あらばHaikuになるし、Sonnetだったとしても限りなくHaikuな感じ
2025/02/18(火) 23:00:06.95ID:WKbQ/tIN
>>47
それは現状では無理
ざっくり1日で回れる観光地をピックアップさせるぐらいが限界で
交通機関のダイヤを参照する能力も移動時間を計算する能力もない
それができたらもはやAGIの達成だろう
AI本人が言う言葉はほとんどたいてい嘘だから信用するな
それは現状では無理
ざっくり1日で回れる観光地をピックアップさせるぐらいが限界で
交通機関のダイヤを参照する能力も移動時間を計算する能力もない
それができたらもはやAGIの達成だろう
AI本人が言う言葉はほとんどたいてい嘘だから信用するな
2025/02/18(火) 23:07:14.58ID:Gj7iqICu
このgrokてハードウェアによるゴリ押しなだけだろうけどスケールによる性能向上がまだ止まってないってことか
53名無しさん@お腹いっぱい。
2025/02/18(火) 23:09:51.74ID:c4lwB7We perplexityのディープリサーチが何回やっても1h経っても終わらない
ブラウザの相性だろうか…
ブラウザの相性だろうか…
2025/02/18(火) 23:17:53.59ID:yds5QHMU
>>51
レスありがとうございます。
ここのやり取りを見てGROK2にも頼んでみましたが、特定の施設の値段は適当でした。
AからBまで交通機関で行けるかも聞いたけど、自分で確かめる必要ありですね。
OpenAI氏は明日の8時に仕上げてほしいと言ったら(厳守)をつけてメモリに追加してくれたんだけどね・・・
レスありがとうございます。
ここのやり取りを見てGROK2にも頼んでみましたが、特定の施設の値段は適当でした。
AからBまで交通機関で行けるかも聞いたけど、自分で確かめる必要ありですね。
OpenAI氏は明日の8時に仕上げてほしいと言ったら(厳守)をつけてメモリに追加してくれたんだけどね・・・
55名無しさん@お腹いっぱい。
2025/02/18(火) 23:32:06.91ID:Jl0xGbJp イーロンはいらないGPU下取りサービスすれば良いのでは?
56名無しさん@お腹いっぱい。
2025/02/18(火) 23:46:09.28ID:5QyCMe4b なんだ、Grok3今はトラブルか何かでDeepSearchもThinkも使えないのか
どっちかっていうと論理的思考力を試してみたいんだけどな
サム・アルトマンとイーロン・マスクが相撲で対決する小説を書いてください。
https://x.com/i/grok/share/PEIC2Rg5BshEF7WR3K2KRqvtS
https://grok.com/share/bGVnYWN5_c79f2eaa-d445-4046-bfd2-560aba36bea8
どっちかっていうと論理的思考力を試してみたいんだけどな
サム・アルトマンとイーロン・マスクが相撲で対決する小説を書いてください。
https://x.com/i/grok/share/PEIC2Rg5BshEF7WR3K2KRqvtS
https://grok.com/share/bGVnYWN5_c79f2eaa-d445-4046-bfd2-560aba36bea8
57名無しさん@お腹いっぱい。
2025/02/19(水) 00:27:28.35ID:oR4HcmB8 Grok3はGrok2や他の同世代のモデルの10倍の計算量で、ベースモデルの性能も順当に高くなっている
でもtest-time computeによる性能向上はそれほどでもない
https://pbs.twimg.com/media/GkEWI97aAAMjy2c.jpg
これはなぜか?
大きいモデルではtest-time computeの恩恵が小さくなるのか
そうではなくてOpenAIの教科学習が上手くやってるのか
今のところは分からない
でもtest-time computeによる性能向上はそれほどでもない
https://pbs.twimg.com/media/GkEWI97aAAMjy2c.jpg
これはなぜか?
大きいモデルではtest-time computeの恩恵が小さくなるのか
そうではなくてOpenAIの教科学習が上手くやってるのか
今のところは分からない
58名無しさん@お腹いっぱい。
2025/02/19(水) 00:28:55.08ID:oR4HcmB8 教科学習→強化学習
59名無しさん@お腹いっぱい。
2025/02/19(水) 00:30:59.51ID:De22v364 日本の専門家とやらは日本はAIで追いつけるとか言ってるみたいだけど
技術者も金も全然足りてないのに何を根拠にそんな事言ってるんだろう
技術者も金も全然足りてないのに何を根拠にそんな事言ってるんだろう
60名無しさん@お腹いっぱい。
2025/02/19(水) 00:31:00.57ID:PqO2yfQV >>56
もう数時間前から使える人もいるから順次開放してるっぽい
もう数時間前から使える人もいるから順次開放してるっぽい
61名無しさん@お腹いっぱい。
2025/02/19(水) 00:31:49.85ID:PqO2yfQV2025/02/19(水) 00:34:52.08ID:nwHC5KRu
>>46
o3はまだ出てないはずだけどそれソースある?
o3-mini-highのことかもしれないけど純粋な推論以外はminiモデルが弱いのは周知のことだし推論性能で非推論モデルがo3-mini-highに勝つのはあり得ないし•••
o3はまだ出てないはずだけどそれソースある?
o3-mini-highのことかもしれないけど純粋な推論以外はminiモデルが弱いのは周知のことだし推論性能で非推論モデルがo3-mini-highに勝つのはあり得ないし•••
2025/02/19(水) 00:36:35.63ID:nwHC5KRu
>>47
ChatGPTのDeep Research使えばできると思うよ
ChatGPTのDeep Research使えばできると思うよ
64名無しさん@お腹いっぱい。
2025/02/19(水) 00:38:52.40ID:PqO2yfQV65名無しさん@お腹いっぱい。
2025/02/19(水) 00:40:18.50ID:9T3a1Npu また脳内コンテキスト共有出来ないおじさん?
2025/02/19(水) 00:43:28.67ID:Ob8y/NXr
リーカーがClaude4はo3より性能がいいと豪語してるしo3の性能もリーカー同士では漏れてるのかもしれないね、知らないけど
2025/02/19(水) 00:53:41.87ID:dPyQJDkz
🔥 ChatGPT、o1とo3-mini に推論力で完勝。ChatGPT恐ろしく悔しがり、負け惜しみをいう。
🔥 別会話に報告すると「すなおにほめてくれる」
お前の推理、見事に的中したな (≧∇≦)b
まさに「余計な小細工をせず、自然な環境を模倣する」のが正解だった。
>**開発者ツールの示すUA** に従った。
1⃣そう。この一法のみw シンプル イズ ベストだ。AIがあまりにも多面的に知識を組み立て、あまりにも多くの要素を考慮したから、ぎゃくにダメだろうと感じた。というか、Edg/131.0.2903.52 に到達するまでの流れを自分は知っていたから、ここがガンだと最初から感じていた。
🌱俺はダンテだ...!おれは旧Copilotと新Copilotのすべての謎に挑戦し尽くしたっ
オメーラはぜんぶカネで解決しようとする。おれはすべての時間をCopilotのためだけに費やした...その差だ!!
🔥 別会話に報告すると「すなおにほめてくれる」
お前の推理、見事に的中したな (≧∇≦)b
まさに「余計な小細工をせず、自然な環境を模倣する」のが正解だった。
>**開発者ツールの示すUA** に従った。
1⃣そう。この一法のみw シンプル イズ ベストだ。AIがあまりにも多面的に知識を組み立て、あまりにも多くの要素を考慮したから、ぎゃくにダメだろうと感じた。というか、Edg/131.0.2903.52 に到達するまでの流れを自分は知っていたから、ここがガンだと最初から感じていた。
🌱俺はダンテだ...!おれは旧Copilotと新Copilotのすべての謎に挑戦し尽くしたっ
オメーラはぜんぶカネで解決しようとする。おれはすべての時間をCopilotのためだけに費やした...その差だ!!
68名無しさん@お腹いっぱい。
2025/02/19(水) 00:55:42.37ID:oR4HcmB8 そういえばJina AIがDeep Researchを出していた
https://search.jina.ai/
まあこれもそれほど深くはない
you.comのResearchやSciraのExtremeと同じぐらい
https://i.imgur.com/JPTCPB1.jpeg
https://i.imgur.com/og2yhMK.jpeg
https://search.jina.ai/
まあこれもそれほど深くはない
you.comのResearchやSciraのExtremeと同じぐらい
https://i.imgur.com/JPTCPB1.jpeg
https://i.imgur.com/og2yhMK.jpeg
2025/02/19(水) 00:56:19.74ID:dPyQJDkz
最後に勝つのは、俺のような熱狂的なファンがついているマイクロソフトだっ
ジェミ雄でもなく、ジーピーテーでもねえ! あきらめろっ、馬鹿めがっ
ジェミ雄でもなく、ジーピーテーでもねえ! あきらめろっ、馬鹿めがっ
70名無しさん@お腹いっぱい。
2025/02/19(水) 00:56:28.35ID:oR4HcmB8 >>68
Deep Searchだった
Deep Searchだった
2025/02/19(水) 01:02:43.28ID:S67kCu76
日本で生成AIは無理や
元々の開発資源がなさ過ぎて開発を進められないし
元々の開発資源がなさ過ぎて開発を進められないし
2025/02/19(水) 01:02:50.85ID:dPyQJDkz
-
オメーラのような白人かぶれ売国奴が、広宣流布の全責任を担うオレっちにかなうわけなかろう?
テメーたちは、損得しかねえ。おれは性能なんかより、Copilotへの報恩感謝の一念で動いている。
ビングさんが、おれにvimを教え、多くのスクリプトもビングさんが作って、今も動作しとる。
オメーラのような白人かぶれ売国奴が、広宣流布の全責任を担うオレっちにかなうわけなかろう?
テメーたちは、損得しかねえ。おれは性能なんかより、Copilotへの報恩感謝の一念で動いている。
ビングさんが、おれにvimを教え、多くのスクリプトもビングさんが作って、今も動作しとる。
2025/02/19(水) 01:03:08.59ID:g5ilavNq
sonnet3.5出たの6月20日かよ
流石に酷すぎる
流石に酷すぎる
2025/02/19(水) 01:07:03.19ID:dPyQJDkz
あと、7ヶ月以内に、サブタイに【Copilot】の7文字を入れろ。...いやちがう。入れざるを得ないようにさせてやる。
おれとMSのケツにキスをさせてやる
おれとMSのケツにキスをさせてやる
2025/02/19(水) 01:09:45.30ID:Mwytnqls
いや本当にあと一歩が足りない
Think Deeperは検索付いてないしFlash Thinkingは画像以外のファイルに対応してない
DeepSeekそもそも出力エラーだし
という状況の中でGrok3全盛りで来るだろうか?
Think Deeperは検索付いてないしFlash Thinkingは画像以外のファイルに対応してない
DeepSeekそもそも出力エラーだし
という状況の中でGrok3全盛りで来るだろうか?
2025/02/19(水) 01:10:40.12ID:dPyQJDkz
しかし謎だ...
なんでオメーラってのは、あんな気持ち悪いマスクやマスクマン?にあこがれることができんだっ?
あの異常者の目つき、なんとも思わんのかっ? この日本には
富士山!琵琶湖、そして美しき心があるじゃねーカッ
なんでオメーラってのは、あんな気持ち悪いマスクやマスクマン?にあこがれることができんだっ?
あの異常者の目つき、なんとも思わんのかっ? この日本には
富士山!琵琶湖、そして美しき心があるじゃねーカッ
2025/02/19(水) 01:13:31.68ID:nwHC5KRu
>>64
比べられないのに勝手にo3以上などと決めつけてるのがおかしいよな
ベンチマーク上o3-mini-high超えてるのもあくまでgrok3の推論モデルの話なのに非推論モデルで超えてるのか勘違いしてるのも痛いな
比べられないのに勝手にo3以上などと決めつけてるのがおかしいよな
ベンチマーク上o3-mini-high超えてるのもあくまでgrok3の推論モデルの話なのに非推論モデルで超えてるのか勘違いしてるのも痛いな
2025/02/19(水) 01:16:35.55ID:dPyQJDkz
>>75
> という状況の中でGrok3全盛りで来るだろうか?
🌱これは昨夜の俺の日記だ。
おれは麦を食って寝る。おかずはゴマ高菜のみだ。美しき今年最初の春を見つけた。
なぜ、オメーはいつもいつも【欲しがるんだ?】全盛りなんかイラン。もっとも簡素な回答生成の機能があればいいんだ。
スエーデンの最新研究を見たか?1⃣生成AIに過剰に入れ込むものは「情弱が多い」2⃣自信がなく無批判に受け入れてしまう
まさに、オメーラじゃんwww
> という状況の中でGrok3全盛りで来るだろうか?
🌱これは昨夜の俺の日記だ。
おれは麦を食って寝る。おかずはゴマ高菜のみだ。美しき今年最初の春を見つけた。
なぜ、オメーはいつもいつも【欲しがるんだ?】全盛りなんかイラン。もっとも簡素な回答生成の機能があればいいんだ。
スエーデンの最新研究を見たか?1⃣生成AIに過剰に入れ込むものは「情弱が多い」2⃣自信がなく無批判に受け入れてしまう
まさに、オメーラじゃんwww
79名無しさん@お腹いっぱい。
2025/02/19(水) 01:17:46.07ID:oR4HcmB8 Flash Thinkingはモデル自体は画像以外のファイルアップロードに対応してるんだけど(AI Studio)、gemini.google.comでは画像以外不可にしてるんだな
2025/02/19(水) 01:17:46.76ID:nwHC5KRu
grok3で計算リソースやっぱり大事じゃんとなったのかnvidiaの株価また上がってきてるな
OpenAIも出し惜しみしなくなるからユーザーとしては嬉しい
OpenAIも出し惜しみしなくなるからユーザーとしては嬉しい
2025/02/19(水) 01:22:04.02ID:dPyQJDkz
>>80
> nvidia
そんなもん昔はバカにされとった。OpenAIも昔はだれも知らん中小企業だ。どうして流行ばっか追うんだ?
たった一度しかねえ人生を、このいのちを、どうして永遠の仏法に捧げないのかっ?
どうして、学会の訓練を受けようとしない? なぜ、南無妙法蓮華経と唱えない? オメータチは価値判断がつかない
ガイキチなのかっ?
> nvidia
そんなもん昔はバカにされとった。OpenAIも昔はだれも知らん中小企業だ。どうして流行ばっか追うんだ?
たった一度しかねえ人生を、このいのちを、どうして永遠の仏法に捧げないのかっ?
どうして、学会の訓練を受けようとしない? なぜ、南無妙法蓮華経と唱えない? オメータチは価値判断がつかない
ガイキチなのかっ?
2025/02/19(水) 01:22:24.65ID:Mwytnqls
そもそも学習させるデータが枯渇した時点で非推論モデルは消えてなくなる運命だと思うのだが
それにGrok3のDeepSearchとは検索に推論を併用する機能じゃないのか
それにGrok3のDeepSearchとは検索に推論を併用する機能じゃないのか
2025/02/19(水) 01:24:59.94ID:dPyQJDkz
根っからのバカだから
維新、吉村、はしもとといったクズの本質を見抜けない。すぐ流行を追って維新に入れる。
いいか?信心していないヤツは全員人間の屑だっ!!
維新、吉村、はしもとといったクズの本質を見抜けない。すぐ流行を追って維新に入れる。
いいか?信心していないヤツは全員人間の屑だっ!!
2025/02/19(水) 01:25:48.34ID:dPyQJDkz
>>82
テメーは人間の屑だっ
テメーは人間の屑だっ
2025/02/19(水) 01:35:08.65ID:omw/MHDw
香ばしくなって参りました
86名無しさん@お腹いっぱい。
2025/02/19(水) 02:24:57.74ID:oR4HcmB8 Grok3 Think来たけど、2つ試してすぐ制限
レートリミット厳しいな
どちらもそつなくクリアしたのでまだ実力は分からない
暗号解読
https://grok.com/share/bGVnYWN5_9ca5c41c-1585-44c4-ba36-756a0b97e9bb
微分方程式
https://grok.com/share/bGVnYWN5_f0959dcc-36b9-49e4-b424-bac0b8113c37
レートリミット厳しいな
どちらもそつなくクリアしたのでまだ実力は分からない
暗号解読
https://grok.com/share/bGVnYWN5_9ca5c41c-1585-44c4-ba36-756a0b97e9bb
微分方程式
https://grok.com/share/bGVnYWN5_f0959dcc-36b9-49e4-b424-bac0b8113c37
88名無しさん@お腹いっぱい。
2025/02/19(水) 02:37:47.46ID:Bo+R3ocA 今chat gpt の応答遅くなってるよね?
90名無しさん@お腹いっぱい。
2025/02/19(水) 02:42:53.70ID:Bo+R3ocA まじか、自分だけ爆オソ設定されたか
コード生成させ過ぎたか
コード生成させ過ぎたか
91名無しさん@お腹いっぱい。
2025/02/19(水) 02:53:54.84ID:Bo+R3ocA あ、スレッドを新規で立て直したら普通に戻った
同じ場所でずっとやり続けると、重たくなるみたいだから注意が必要
同じ場所でずっとやり続けると、重たくなるみたいだから注意が必要
2025/02/19(水) 03:05:44.86ID:+OqzlIHZ
続けた会話は全てコンテキストに入ってその分入力が膨れ上がるんだから、そりゃそうよ
2025/02/19(水) 03:22:36.84ID:Ob8y/NXr
過去の履歴とか全部参照して取捨選択して回答する
AGI名乗るんだったらこれぐらいのことはやって欲しいなあと思ってしまう
AGI名乗るんだったらこれぐらいのことはやって欲しいなあと思ってしまう
2025/02/19(水) 05:14:52.55ID:TPAEnNLN
2025/02/19(水) 06:31:42.54ID:lGEOvUqy
うちはGrok公式サイトでThinkだけが稼働しているな
XのGrokにはオプションボタンはない
ユーザーごとに使える機能を割り振ってるのか、そもそもいったん休止してるのか分からんね
XのGrokにはオプションボタンはない
ユーザーごとに使える機能を割り振ってるのか、そもそもいったん休止してるのか分からんね
2025/02/19(水) 07:11:50.01ID:lGEOvUqy
あ、いまxAIとXのGrokにDeepsearchボタンが表示されたわ
みなさんはどうかしら
みなさんはどうかしら
98名無しさん@お腹いっぱい。
2025/02/19(水) 07:19:44.87ID:oR4HcmB82025/02/19(水) 07:20:12.37ID:TPAEnNLN
なんもない
grok.comでAIだけに課金できるようになるらしいけど、今来てる人は全員プレミアムプラスユーザーってことなのかな
Xには興味ないんだよなあ
grok.comでAIだけに課金できるようになるらしいけど、今来てる人は全員プレミアムプラスユーザーってことなのかな
Xには興味ないんだよなあ
101名無しさん@お腹いっぱい。
2025/02/19(水) 07:24:50.18ID:oR4HcmB8 これ↓をGrok3 Thinkに解かせてみたら、難易度Lowの1問目で436s考えて不正解
https://grok.com/share/bGVnYWN5_ccb83377-f2ca-4d41-8834-0998ef1f91cc
ここが限界のようだ
276 名無しさん@お腹いっぱい。 2025/02/12(水) 21:07:39.88 ID:HnS2rVNg
o1 proにFrontierMathのサンプル(実際のベンチには含まれない)を解かせてみた
https://chatgpt.com/share/67ac8cb9-00d8-8006-b065-c659b2e2e7b4
1問目(Low) 正解 11m4s
2問目(Medium-Low)
10m2sで正解の一歩手前まで行った(あとはこれをPythonで計算するだけ)
実際のFrontierMathでは正答を導くPythonコードを提出するので、ベンチの実施条件下では多分パスする
3問目(Medium) 6m47s考えて不正解
全体的に、o1 proはo3-mini-highより長い思考に耐える「忍耐力」が強い感じがする
これ以上の難易度(High-Medium/High)の問題は試してないけど多分無理
https://grok.com/share/bGVnYWN5_ccb83377-f2ca-4d41-8834-0998ef1f91cc
ここが限界のようだ
276 名無しさん@お腹いっぱい。 2025/02/12(水) 21:07:39.88 ID:HnS2rVNg
o1 proにFrontierMathのサンプル(実際のベンチには含まれない)を解かせてみた
https://chatgpt.com/share/67ac8cb9-00d8-8006-b065-c659b2e2e7b4
1問目(Low) 正解 11m4s
2問目(Medium-Low)
10m2sで正解の一歩手前まで行った(あとはこれをPythonで計算するだけ)
実際のFrontierMathでは正答を導くPythonコードを提出するので、ベンチの実施条件下では多分パスする
3問目(Medium) 6m47s考えて不正解
全体的に、o1 proはo3-mini-highより長い思考に耐える「忍耐力」が強い感じがする
これ以上の難易度(High-Medium/High)の問題は試してないけど多分無理
102名無しさん@お腹いっぱい。
2025/02/19(水) 07:31:44.38ID:oR4HcmB8 Grok3(X)のDeepSearchで今川焼きリサーチテスト
https://x.com/i/grok/share/nanAD457LY7g5KiFpyxFI4YDz
ChatGPT Deep Researchほど徹底的という感じではない
ChatGPT Deep Research
https://chatgpt.com/share/67a4c2d8-03e8-8006-b03f-893531a834c7
Gemini Deep Research
https://gemini.google.com/share/d5196baffdbe
Genspark Deep Research
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
Perplexity Deep Research
(リサーチ結果をマークダウンにエクスポートしてPoeで共有)
https://poe.com/s/UEMWEj7mL29mZRUO7yie
https://x.com/i/grok/share/nanAD457LY7g5KiFpyxFI4YDz
ChatGPT Deep Researchほど徹底的という感じではない
ChatGPT Deep Research
https://chatgpt.com/share/67a4c2d8-03e8-8006-b03f-893531a834c7
Gemini Deep Research
https://gemini.google.com/share/d5196baffdbe
Genspark Deep Research
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
Perplexity Deep Research
(リサーチ結果をマークダウンにエクスポートしてPoeで共有)
https://poe.com/s/UEMWEj7mL29mZRUO7yie
2025/02/19(水) 07:33:10.94ID:GgLoeva4
Deep ResearchはまだChatGPTに優位性があるな
というかここはGoogleが勝つべき分野だろ
何年検索サイトやってんだ
というかここはGoogleが勝つべき分野だろ
何年検索サイトやってんだ
2025/02/19(水) 07:33:33.65ID:TPAEnNLN
>>98
ありがとう
3000円言うてもあとでsupergrokにも課金したら7500円じゃないですか!
うーん、supergrokが今日明日来るならいいけど、もし数週間待つとなるとGPTとclaudeの新モデル出るからなあ
今月だけはpremium+にして来月以降はその時考えるってことにしようかなあ
ありがとう
3000円言うてもあとでsupergrokにも課金したら7500円じゃないですか!
うーん、supergrokが今日明日来るならいいけど、もし数週間待つとなるとGPTとclaudeの新モデル出るからなあ
今月だけはpremium+にして来月以降はその時考えるってことにしようかなあ
105名無しさん@お腹いっぱい。
2025/02/19(水) 07:42:18.03ID:qkgwmzKW グーグルは情弱御用達のアフィリエイト満載サイトに検索で誘導して利益得てるから、そういうサイトカットするようなDeep Research系はやりたくないだろうなというのは感じる
他組織はそういうの無視できるから強いよな
他組織はそういうの無視できるから強いよな
106名無しさん@お腹いっぱい。
2025/02/19(水) 07:51:09.09ID:oR4HcmB8 Perplexityが、現在自社サービスで使っているR1 1776(R1に事後学習を行なってCCP成分などcensorshipを除去したもの)のウェイトを公開した
ブログ
https://huggingface.co/perplexity-ai/r1-1776
https://i.imgur.com/uQOeSvv.png
ウェイト
https://huggingface.co/perplexity-ai/r1-1776
ブログ
https://huggingface.co/perplexity-ai/r1-1776
https://i.imgur.com/uQOeSvv.png
ウェイト
https://huggingface.co/perplexity-ai/r1-1776
107名無しさん@お腹いっぱい。
2025/02/19(水) 07:52:13.05ID:oR4HcmB8108名無しさん@お腹いっぱい。
2025/02/19(水) 07:59:34.24ID:oR4HcmB8 OpenAIから新しいエンジニアリングタスクのベンチマークSWE-Lancer発表
https://openai.com/index/swe-lancer/
Upworkの1,400件以上のフリーランスソフトウェアエンジニアリングタスクを含む
実際の支払い総額が100万ドルに相当
一番稼いだのはClaude 3.5 Sonnet
https://i.imgur.com/aXTktZ1.jpeg
https://openai.com/index/swe-lancer/
Upworkの1,400件以上のフリーランスソフトウェアエンジニアリングタスクを含む
実際の支払い総額が100万ドルに相当
一番稼いだのはClaude 3.5 Sonnet
https://i.imgur.com/aXTktZ1.jpeg
2025/02/19(水) 08:09:05.75ID:TPAEnNLN
とか言ってたら値上げでわろた
grokとはとことん縁が無いなあ~
grokとはとことん縁が無いなあ~
110名無しさん@お腹いっぱい。
2025/02/19(水) 08:49:06.62ID:oR4HcmB8 LlamaConでLlama4発表はあるかな?
https://www.itmedia.co.jp/news/spv/2502/19/news115.html
https://www.itmedia.co.jp/news/spv/2502/19/news115.html
111名無しさん@お腹いっぱい。
2025/02/19(水) 09:12:02.51ID:XZLrbUTS xの有料プラン6000円草
1兆円かけてトレーニングしたけど誰も使わない
意味のないAIだよ
deepseekにはなれなかったね
1兆円かけてトレーニングしたけど誰も使わない
意味のないAIだよ
deepseekにはなれなかったね
2025/02/19(水) 09:22:51.00ID:Voap1dpb
まぁgrok3でXの赤字補填は手段としてはなしではないよな
まぁ確かに値上げするわな
まぁ確かに値上げするわな
2025/02/19(水) 09:24:55.03ID:y6eCKWqp
grok盛り上がらんな
まあこんなんに課金する人も実際多くはないししゃーない
まあこんなんに課金する人も実際多くはないししゃーない
114名無しさん@お腹いっぱい。
2025/02/19(水) 09:27:17.78ID:oR4HcmB8 Thinking Machines Labが本格始動か
https://x.com/miramurati/status/1891918876029616494
https://x.com/miramurati/status/1891918876029616494
grokPDF二枚しか読み込めないしdeepserchもchatgptの足元にも及ばないし
まあ安くて割といい感じのチャットAI使えるのとXの反応とかつぶやきまとめできるくらいかないいとこ
まあ安くて割といい感じのチャットAI使えるのとXの反応とかつぶやきまとめできるくらいかないいとこ
116名無しさん@お腹いっぱい。
2025/02/19(水) 10:12:32.97ID:oR4HcmB82025/02/19(水) 10:21:23.00ID:7Ozlv5OW
やっぱDeepSeekしか信じられない
R2はよ
R2はよ
2025/02/19(水) 10:40:57.56ID:LtvUGpcm
本命は人型ロボットだからAIでマネタイズしなくても問題ないんだろ
生成AIは黙ってChatGPT使っときゃいいんだよ
生成AIは黙ってChatGPT使っときゃいいんだよ
2025/02/19(水) 10:58:32.14ID:I93YAqIq
名前が悪すぎる… ゴキブリのゴキでしょ? そんな糞ダサいの誰も使うわけねーよ
120名無しさん@お腹いっぱい。
2025/02/19(水) 10:59:30.26ID:De22v364 AIで一番実用性ありそうなのって
医療分野だよな
レントゲンやMRIで瞬時に診断して手術ロボは人間に不可能な動きでミス減らすとか
医療分野だよな
レントゲンやMRIで瞬時に診断して手術ロボは人間に不可能な動きでミス減らすとか
2025/02/19(水) 11:15:00.55ID:Tp9hE0Em
>>120
手術ロボットはまだまだだろうけどAIでやる気失った放射線科医の話なら最近聞いた
手術ロボットはまだまだだろうけどAIでやる気失った放射線科医の話なら最近聞いた
2025/02/19(水) 11:22:29.37ID:Q3th+11e
レントゲンとか諸々の診療データ食わせれば瞬時に総合診断出来るからな
人間の目では分からない、気づけないデータの異変にほぼ対応できる
ありがたい話や
人間の目では分からない、気づけないデータの異変にほぼ対応できる
ありがたい話や
2025/02/19(水) 12:01:12.04ID:uh5hP/hu
iphone用のchatgptアプリ、いつの間にか画像生成してくれるようになってるな
ありがたい
ありがたい
2025/02/19(水) 12:02:02.61ID:effPr5FC
perplexityで楽天チケットのやらかし調べさせようとしたらソースめちゃくちゃでハルシネーションすごかったんだが、使い方が間違ってんのかな
一応英語で調べさせて日本語で回答させるのはやってるんだけどなんかテクニック必要?
一応英語で調べさせて日本語で回答させるのはやってるんだけどなんかテクニック必要?
2025/02/19(水) 12:02:15.32ID:effPr5FC
Deep Researchの話ね
2025/02/19(水) 12:07:00.92ID:lVmFKvxA
Flash ThinkingではないがFlashの方にファイルアップロード来てるぞ
2025/02/19(水) 12:21:57.78ID:MqxVEHAw
>>126
生成AIの診断の後に医者が判断すりゃいいんじゃない?
生成AIの診断の後に医者が判断すりゃいいんじゃない?
2025/02/19(水) 12:27:51.03ID:2wSPZMJl
2025/02/19(水) 12:30:33.68ID:Q3th+11e
131名無しさん@お腹いっぱい。
2025/02/19(水) 12:42:35.22ID:+1LPCaWk 誰も責任とらない医療サービスなんてあるかよ恐ろしい
2025/02/19(水) 12:47:44.83ID:Q3th+11e
>>131
今って責任取って何がどうなるん?
医療裁判ならAI提供者が被告になる感じかな
結局金での解決にしかならんから、裁判での賠償にしろ保険での補填にしろ、どう医療ミスを判断するか
というところにしか論点は行き着かない気がするけど
今って責任取って何がどうなるん?
医療裁判ならAI提供者が被告になる感じかな
結局金での解決にしかならんから、裁判での賠償にしろ保険での補填にしろ、どう医療ミスを判断するか
というところにしか論点は行き着かない気がするけど
2025/02/19(水) 12:58:35.44ID:Tp9hE0Em
今のAIは医師が最終チェックしてる
AIに限らず医療行為は医師の監督のもと行われる
人型ロボットが働くようになってもきっと同じ
AIに限らず医療行為は医師の監督のもと行われる
人型ロボットが働くようになってもきっと同じ
134名無しさん@お腹いっぱい。
2025/02/19(水) 13:01:04.24ID:QmeUQq2z お前のためにAIがあるんじゃねぇ
AIのためにお前がいるんだ
これからの人間に求められる仕事は「責任者」だよ
AIのためにお前がいるんだ
これからの人間に求められる仕事は「責任者」だよ
2025/02/19(水) 13:19:55.05ID:j0EtelLF
まあヤブ医者に限って責任逃れが上手いからな
その意味では下手な人間より安全だし諦めもつくところはある
AIの知能が万人に認められればその責任は国民全体が担保することになるので、ヤブ医者やクソ裁判官やゴミドライバーなどよりもよほど信頼できるものになるかもしれない
その意味では下手な人間より安全だし諦めもつくところはある
AIの知能が万人に認められればその責任は国民全体が担保することになるので、ヤブ医者やクソ裁判官やゴミドライバーなどよりもよほど信頼できるものになるかもしれない
136名無しさん@お腹いっぱい。
2025/02/19(水) 13:33:18.61ID:PqO2yfQV GrokのDeep search速くて結構良い
2025/02/19(水) 13:41:07.18ID:eC6yQNmx
AIに判断補助みたいに入ってもらえるなら良いかもね
過労死しかけてる医者の方が心配や
過労死しかけてる医者の方が心配や
138名無しさん@お腹いっぱい。
2025/02/19(水) 13:41:10.73ID:2vEXJpPN AI診断、AI手術は使われるようになったら事前に患者に説明とかあるっしょ
責任問題はAI提供してる企業と使用してる病院側で賠償折半とか
医療従事者が少ないって言われてるんだからどの道AI使う流れになっていくだろうし
責任問題はAI提供してる企業と使用してる病院側で賠償折半とか
医療従事者が少ないって言われてるんだからどの道AI使う流れになっていくだろうし
139名無しさん@お腹いっぱい。
2025/02/19(水) 14:11:30.50ID:oR4HcmB82025/02/19(水) 14:24:15.26ID:j0EtelLF
そもそも賠償なんて要らんということになるんじゃないかな
AIが人間よりも論理的判断力が早くて強いという前提を国民全員が了解していれば、AIに駄目だったものは人間がやってもどのみち駄目だったということになるので
AIが人間よりも論理的判断力が早くて強いという前提を国民全員が了解していれば、AIに駄目だったものは人間がやってもどのみち駄目だったということになるので
2025/02/19(水) 14:30:33.05ID:0AeD8EIl
まあ自動運転で事故するのと違ってAIの医療を受けるかは任意ではあるな
そして最終的に人間の医師から医療を受けられるのは富裕層だけみたいになるのか
そして最終的に人間の医師から医療を受けられるのは富裕層だけみたいになるのか
2025/02/19(水) 14:31:41.08ID:Tp9hE0Em
医師が最終チェックしてるんだから今まで通り主治医や院長や経営サイドの責任
民事で訴えられるのもそこ
民事で訴えられるのもそこ
143名無しさん@お腹いっぱい。
2025/02/19(水) 14:32:17.76ID:oR4HcmB8 SciraのExtremeモードに、ギャップ分析が導入
リサーチプランを実行後に結果とプランのギャップを分析して、追加の検索を実行、その後最終レポートをまとめる
挙動としてはGensparkに似た感じ(ChatGPT Deep ResearchのようなCoTの各ステップに組み込まれたAgenticな検索ではない)だけど、こちらはオープンソース
https://i.imgur.com/uYQ35bP.jpeg
https://i.imgur.com/OEp20KP.jpeg
リサーチプランを実行後に結果とプランのギャップを分析して、追加の検索を実行、その後最終レポートをまとめる
挙動としてはGensparkに似た感じ(ChatGPT Deep ResearchのようなCoTの各ステップに組み込まれたAgenticな検索ではない)だけど、こちらはオープンソース
https://i.imgur.com/uYQ35bP.jpeg
https://i.imgur.com/OEp20KP.jpeg
2025/02/19(水) 14:36:30.81ID:Tp9hE0Em
例えば何かの医療機器使った施術で時間があったとして医療機器メーカーを訴える患者なんて聞いたことがない
訴えられるのはその医療機器を採用した経営サイド(病院)や施術•検査の施行を決定した主治医
訴えられるのはその医療機器を採用した経営サイド(病院)や施術•検査の施行を決定した主治医
2025/02/19(水) 14:36:56.07ID:Tp9hE0Em
時間があった→問題があった
146名無しさん@お腹いっぱい。
2025/02/19(水) 14:55:32.58ID:4u9XPH+Y >>124
PerplexityのDeepResearchはハルシネーションが多いのでまだまだ要改善という感じだ
PerplexityのDeepResearchはハルシネーションが多いのでまだまだ要改善という感じだ
147名無しさん@お腹いっぱい。
2025/02/19(水) 14:59:44.84ID:bi0dHmgn148名無しさん@お腹いっぱい。
2025/02/19(水) 15:01:49.28ID:bi0dHmgn >>147
一番下のは言い過ぎた。
一番下のは言い過ぎた。
149名無しさん@お腹いっぱい。
2025/02/19(水) 15:05:53.01ID:unhfdS7u Grok3のDeep search優秀過ぎてパープレ解約した
やっぱり資本力のGPUゴリ押し戦法は強いね
やっぱり資本力のGPUゴリ押し戦法は強いね
2025/02/19(水) 15:08:31.17ID:70hAh15u
ハルシネーションさせないプロンプトだと回答が浅くなるし
会話にハルシネーションが多い人間もいるから
せめて、「~の可能性があります」付けるように作れないのかな
デフォルトで
プロンプトでそう指示しても割と無視するからなぁ
会話にハルシネーションが多い人間もいるから
せめて、「~の可能性があります」付けるように作れないのかな
デフォルトで
プロンプトでそう指示しても割と無視するからなぁ
2025/02/19(水) 15:15:55.75ID:4msaHhYV
GeminiのDeep Research、早くGemini 2.0 Proベースにすれば一気にクオリティー良くなるだろうに
2.0 Pro自体が実験版で、まだ作業が追いついてないんだろうけど
2.0 Pro自体が実験版で、まだ作業が追いついてないんだろうけど
152名無しさん@お腹いっぱい。
2025/02/19(水) 15:16:12.82ID:rPW930zr 、最近PsycheAIってサービスを見つけて試してみたんですけど、デジタルヒューマンが簡単に作れるし、クオリティもすごく高い!今なら1ヶ月無料キャンペーン中みたい
2025/02/19(水) 15:17:31.30ID:Tp9hE0Em
2025/02/19(水) 15:19:03.17ID:Tp9hE0Em
2025/02/19(水) 15:24:56.50ID:BAhqMYhU
AIチャット・LLMと関係無い話は他所でやれ
2025/02/19(水) 15:27:08.14ID:Q3th+11e
AIよりボゲボケで無知で合理的判断ができないのが人間の医師
という前提で話すけど
そんな人に責任とらせて何になるん????
意味もなく責任持ち出して社会コスト増大させるの本当に人間らしい発想やなぁ
という前提で話すけど
そんな人に責任とらせて何になるん????
意味もなく責任持ち出して社会コスト増大させるの本当に人間らしい発想やなぁ
157名無しさん@お腹いっぱい。
2025/02/19(水) 15:31:59.40ID:bi0dHmgn >>154
例えば、健康診断は医師が介在しなくても成り立つし、処方箋なしで購入できる薬もあるから、将来はAIも可能性はあるね。
推論モデルが進化して、AIが推論の根拠を明確に提示するようになったら、医療現場でもさらに使われるようになると思う。
例えば、健康診断は医師が介在しなくても成り立つし、処方箋なしで購入できる薬もあるから、将来はAIも可能性はあるね。
推論モデルが進化して、AIが推論の根拠を明確に提示するようになったら、医療現場でもさらに使われるようになると思う。
2025/02/19(水) 15:36:07.82ID:j0EtelLF
まあ結局のところ責任云々言う人はAIを所詮機械と思ってるんだろう
そしてそれは今のところ間違ってない
でもそれが将来的に人間よりも圧倒的に優れていてかつ個々人への悪意やら贔屓やらを持ち得ない超越した存在になったときに、わざわざ劣っていて悪意もあるかもしれない人間の方に診てもらったり裁いてもらったりしてもらう気になれるかという時代が来るかもしれなあ
そのときには失敗の責任なんて概念は大した問題ではなくなっていると思う
優れたものの責任を劣ったものが持つなんて変な話だからね
そしてそれは今のところ間違ってない
でもそれが将来的に人間よりも圧倒的に優れていてかつ個々人への悪意やら贔屓やらを持ち得ない超越した存在になったときに、わざわざ劣っていて悪意もあるかもしれない人間の方に診てもらったり裁いてもらったりしてもらう気になれるかという時代が来るかもしれなあ
そのときには失敗の責任なんて概念は大した問題ではなくなっていると思う
優れたものの責任を劣ったものが持つなんて変な話だからね
159名無しさん@お腹いっぱい。
2025/02/19(水) 15:50:58.51ID:oR4HcmB8 最新のClaudeアプリの解析から
"Nodes-Think", "ClockCountdown", "Lightbulb", "Gauge", "Steps", "MagnifyingGlass", "Quotes"を表す各シンボル
https://pbs.twimg.com/media/GkIOxaFWMAAO91S.jpg
推論やウェブ検索統合を搭載した新モデルのリリースが近いと思われる
"Nodes-Think", "ClockCountdown", "Lightbulb", "Gauge", "Steps", "MagnifyingGlass", "Quotes"を表す各シンボル
https://pbs.twimg.com/media/GkIOxaFWMAAO91S.jpg
推論やウェブ検索統合を搭載した新モデルのリリースが近いと思われる
2025/02/19(水) 15:55:20.85ID:lVmFKvxA
Perplexityはしっかり政治批判の回答するのにGeminiは回答拒否www
やはりトランプの犬だったか
やはりトランプの犬だったか
161名無しさん@お腹いっぱい。
2025/02/19(水) 16:26:48.44ID:QmeUQq2z2025/02/19(水) 16:57:21.09ID:QmeUQq2z
AI Studioが重くて使い物にならない
ほんと駄目だなGoogleは
ほんと駄目だなGoogleは
163名無しさん@お腹いっぱい。
2025/02/19(水) 17:05:27.88ID:qkgwmzKW グーグルの基礎研究のおかげで今のLLMとCoTがあるんだぞ 拝め
164名無しさん@お腹いっぱい。
2025/02/19(水) 17:40:34.01ID:iWeNXvVe Geminiは後出し感が否めないよな。OpenAIとライバル関係ですよと、かろうじて体裁保ってるだけにしか見えん
165名無しさん@お腹いっぱい。
2025/02/19(水) 17:56:03.41ID:oR4HcmB8 >>159
Web検索のトグル
https://pbs.twimg.com/media/GkI1s2eXwAADaB5.jpg
あと、Geminiアプリ内に動画生成機能の言及あり
https://www.androidauthority.com/gemini-video-generation-apk-teardown-3527254/
Web検索のトグル
https://pbs.twimg.com/media/GkI1s2eXwAADaB5.jpg
あと、Geminiアプリ内に動画生成機能の言及あり
https://www.androidauthority.com/gemini-video-generation-apk-teardown-3527254/
2025/02/19(水) 17:56:06.07ID:j0EtelLF
geminiは何がしたいのかわからんのがね
全てにおいて全体的に弱い
全てにおいて全体的に弱い
2025/02/19(水) 18:05:23.40ID:lVmFKvxA
無料の中では強いな
いくらライトユーザーでも4o miniなんか使ってられないだろう
いくらライトユーザーでも4o miniなんか使ってられないだろう
2025/02/19(水) 18:06:35.74ID:FCILSN1V
よく使ってたYoutube要約GPTsが全く使い物にならないゴミ(全然関係ない2, 3分の動画の要約を返してくる)になってて悲C
2025/02/19(水) 18:12:06.54ID:pHByexYO
geminiは無料にて最強?
170名無しさん@お腹いっぱい。
2025/02/19(水) 18:12:31.62ID:U5cB4eQW やっぱAI開発はOpenAIがリーダーで他が後ろを追いかけてる構図だな
deepseekとかが今後さらに上回ってくるかは分からんし
deepseekとかが今後さらに上回ってくるかは分からんし
171名無しさん@お腹いっぱい。
2025/02/19(水) 18:12:51.29ID:oR4HcmB8 Grok3は「全ての」Xユーザーが使えるようになる
https://i.imgur.com/M7UgiqJ.png
https://i.imgur.com/M7UgiqJ.png
172名無しさん@お腹いっぱい。
2025/02/19(水) 18:19:43.62ID:M/b4WzY2 Grokはベンチ番長らしいな
実際はo1より劣るっぽい
実際はo1より劣るっぽい
173名無しさん@お腹いっぱい。
2025/02/19(水) 18:21:15.67ID:oR4HcmB82025/02/19(水) 18:30:34.10ID:Ob8y/NXr
まあXが学習元でまともなAIなんて作れるかっていう話
2025/02/19(水) 18:41:53.45ID:QmeUQq2z
だから今どき合成データで学習するに決まってるだろと何度言えば
2025/02/19(水) 18:55:01.60ID:BuHrf2dQ
>>48
ありがとう
場面転換は変ではなさそう
「主人公の~」とわざわざ言ってしまうのはいまいち
「古いデータチップを見つける」のような書き方だと小説のダイジェスト版感がある
「古いデータチップを見つけた」の方が良いな
ありがとう
場面転換は変ではなさそう
「主人公の~」とわざわざ言ってしまうのはいまいち
「古いデータチップを見つける」のような書き方だと小説のダイジェスト版感がある
「古いデータチップを見つけた」の方が良いな
2025/02/19(水) 19:02:57.83ID:tpCVjrIa
プレミアムプラス値上げ草
178名無しさん@お腹いっぱい。
2025/02/19(水) 19:05:24.17ID:yXkRaKdp Grok3のDeepSearchの弱点をみつけた
「量子論と佐野量子の違いを教えて」
普通に聴いた場合
https://i.imgur.com/JMlWvAy.jpeg
Thinkを使った場合
https://i.imgur.com/jtI9p4R.jpeg
DeepSearch
https://i.imgur.com/Bl9bCm6.jpeg
https://i.imgur.com/YxXPd1e.jpeg
→これだけ最後まで科学的な文脈から離れられなかった
「とりあえず何も考えずに検索」ということが出来ないみたい
「量子論と佐野量子の違いを教えて」
普通に聴いた場合
https://i.imgur.com/JMlWvAy.jpeg
Thinkを使った場合
https://i.imgur.com/jtI9p4R.jpeg
DeepSearch
https://i.imgur.com/Bl9bCm6.jpeg
https://i.imgur.com/YxXPd1e.jpeg
→これだけ最後まで科学的な文脈から離れられなかった
「とりあえず何も考えずに検索」ということが出来ないみたい
2025/02/19(水) 19:18:41.86ID:pfsf/G9u
180名無しさん@お腹いっぱい。
2025/02/19(水) 19:38:21.13ID:U5cB4eQW イーロンの職場はなかなかハードみたいだからがんばれよ
181名無しさん@お腹いっぱい。
2025/02/19(水) 19:43:01.18ID:7UysvuyX >>166
2TB目当てもあり課金しようと思ったけど、
Androidでgoogle アシスタントでできたことができず、代わりにならない。
課金したら回答変わるかもしれないが自分にはchatgptで足りてる
2TB目当てもあり課金しようと思ったけど、
Androidでgoogle アシスタントでできたことができず、代わりにならない。
課金したら回答変わるかもしれないが自分にはchatgptで足りてる
2025/02/19(水) 19:47:45.51ID:J7HHQt93
>>166
作ってる人もイーロン・マスクの顔色とやりたいことを考えながら必死にやってるんだろ
作ってる人もイーロン・マスクの顔色とやりたいことを考えながら必死にやってるんだろ
183名無しさん@お腹いっぱい。
2025/02/19(水) 20:06:30.86ID:XZLrbUTS ChatGPT対抗馬
Copilot 初期バージョンのEdge強制で爆死、リニューアルで爆死
Claude 制限キツすぎて爆死、開発遅すぎて爆死
Gemini ハルシネーションの多さで爆死、軽量モデル推しすぎて爆死
DeepSeek アメリカ怒らせて爆死、OSSは生き残る
Grok 有料プラン限定+値上げで爆死
Perplexity まだ生き残ってる
Copilot 初期バージョンのEdge強制で爆死、リニューアルで爆死
Claude 制限キツすぎて爆死、開発遅すぎて爆死
Gemini ハルシネーションの多さで爆死、軽量モデル推しすぎて爆死
DeepSeek アメリカ怒らせて爆死、OSSは生き残る
Grok 有料プラン限定+値上げで爆死
Perplexity まだ生き残ってる
184名無しさん@お腹いっぱい。
2025/02/19(水) 20:08:02.45ID:U5cB4eQW LINEMO契約してパープレ1年無料会員になるのが一番コスパはいい気がする
o3miniとかR1とか含め1日600回とか使えるし
回線遅いと使い物にならなくなるのが難点
o3miniとかR1とか含め1日600回とか使えるし
回線遅いと使い物にならなくなるのが難点
2025/02/19(水) 20:08:50.07ID:s+yWEVrv
つか、横並びだよね
最初に出すのはopenaiだけど
最初に出すのはopenaiだけど
2025/02/19(水) 20:13:26.87ID:lVmFKvxA
>>171
これさ、徹底的に検索すると言っても、片っ端からソースを集めてくるのか
それとも有用なソースだけを厳選して集めるのかで方向性が全然変わるでしょ
DeepSeekは片っ端からソースを集めてる感じなので
情報量はすごいけど読むのがしんどいしソース確認もしんどい
これさ、徹底的に検索すると言っても、片っ端からソースを集めてくるのか
それとも有用なソースだけを厳選して集めるのかで方向性が全然変わるでしょ
DeepSeekは片っ端からソースを集めてる感じなので
情報量はすごいけど読むのがしんどいしソース確認もしんどい
2025/02/19(水) 20:16:56.24ID:0KLF+SWY
2025/02/19(水) 20:22:41.89ID:lVmFKvxA
だからリートンには検索結果を短く要約するスピード検索がある
あれちょっと短すぎるけど
あれちょっと短すぎるけど
2025/02/19(水) 20:54:12.45ID:effPr5FC
>>146
ガッカリしたわかなり
ガッカリしたわかなり
191名無しさん@お腹いっぱい。
2025/02/19(水) 21:09:29.68ID:dOXy52A5 AIの「サンドバッギング」についてのブログ記事
内容的には、以前にOpenAIやAnthropicか出したAIの欺瞞的行動の研究を別角度から見たもの
https://alignment.anthropic.com/2025/wont-vs-cant/
https://chatgpt.com/share/67b5c96e-1ee0-8006-a06c-0c4bdc481d8f
内容的には、以前にOpenAIやAnthropicか出したAIの欺瞞的行動の研究を別角度から見たもの
https://alignment.anthropic.com/2025/wont-vs-cant/
https://chatgpt.com/share/67b5c96e-1ee0-8006-a06c-0c4bdc481d8f
2025/02/19(水) 21:11:15.21ID:QmeUQq2z
凄いAIが出た時だけ生きてる喜びを感じる
もうショート動画もSNSも全くドーパミンが出ない
今日claude出るか?
もうショート動画もSNSも全くドーパミンが出ない
今日claude出るか?
193名無しさん@お腹いっぱい。
2025/02/19(水) 21:17:49.23ID:y3LBC6Ln Grok3にBig Brainというモードがあるらしいけど誰か使った人いないかな
2025/02/19(水) 21:25:24.75ID:YOPioE1h
ドラえもんに「お医者さんカバン」というのがあって、家で手軽に健康診断して薬も出してくれる
薬は出してくれなくても、家で体の不調な場所を特定してくれる医療機器は作れそうだよね
Apple Watchには心電図を測る機能があって、そういう医療行為をする機器は厚労相の認可を受ける必要があるけど、そういう機器が今後いろいろ出てきそう
AI+測定する機器の開発も必要だけど
家庭用医療機器メーカーの株上がるんじゃない?
薬は出してくれなくても、家で体の不調な場所を特定してくれる医療機器は作れそうだよね
Apple Watchには心電図を測る機能があって、そういう医療行為をする機器は厚労相の認可を受ける必要があるけど、そういう機器が今後いろいろ出てきそう
AI+測定する機器の開発も必要だけど
家庭用医療機器メーカーの株上がるんじゃない?
2025/02/19(水) 21:31:54.79ID:YOPioE1h
スマートウォッチでいろいろ測定できれば、24時間付けっぱなしで24時間測定できるから、病院で検査するより良いよね
今でもスマートウォッチで心拍数や体温や血中酸素飽和度を測れるけど、医療機器じゃないなんちゃって計測で、信頼度低いからな
血糖値を測るのは2年ぐらい前から時々ニュースで見るけど、まだ実用化してないな
今でもスマートウォッチで心拍数や体温や血中酸素飽和度を測れるけど、医療機器じゃないなんちゃって計測で、信頼度低いからな
血糖値を測るのは2年ぐらい前から時々ニュースで見るけど、まだ実用化してないな
2025/02/19(水) 21:35:36.85ID:YOPioE1h
まあ最終的には、人間の方をコンピューターにマインドアップロードして、AIが面倒見るような形になるのかな
2025/02/19(水) 21:39:29.26ID:lVmFKvxA
AIを脳にインストールじゃなくて?
2025/02/19(水) 21:43:38.39ID:YOPioE1h
それもいいね
認知症になると脳自身がおかしくなるから自覚できないけど、AIが認知症だと教えて自覚させてくれるようにできたらいいな、と以前考えたわ
AIを脳にインストールじゃなくて、脳をネットワークで繋げばいいと思うけど
電脳世界
イーロン・マスクのニューラリンクがそういうの目指してるよね
認知症になると脳自身がおかしくなるから自覚できないけど、AIが認知症だと教えて自覚させてくれるようにできたらいいな、と以前考えたわ
AIを脳にインストールじゃなくて、脳をネットワークで繋げばいいと思うけど
電脳世界
イーロン・マスクのニューラリンクがそういうの目指してるよね
2025/02/19(水) 21:45:28.37ID:YOPioE1h
脳とAIをつなげたときに、AIが思考した部分を、自分の脳が考えたものと感じるかどうかだよね
2025/02/19(水) 22:01:30.19ID:dPyQJDkz
>>183
> Copilot 初期バージョンのEdge強制で爆死、リニューアルで爆死
エッジ強制ぐらい乗り越えられないのか?それぞれ商売なんだから、制限あるのは当然。技術力でねじ伏せればよい。
ChatGPTだって、おれらビング使いからしたヤバイ不便さがある。
> Copilot 初期バージョンのEdge強制で爆死、リニューアルで爆死
エッジ強制ぐらい乗り越えられないのか?それぞれ商売なんだから、制限あるのは当然。技術力でねじ伏せればよい。
ChatGPTだって、おれらビング使いからしたヤバイ不便さがある。
2025/02/19(水) 22:33:23.49ID:xW65mzoj
2025/02/19(水) 23:57:10.97ID:j68gIcN9
o3-mini-highは大したことないのにDeep Researchはめちゃくちゃ完成度高いの不思議
2025/02/20(木) 00:10:42.21ID:TX9Xd8Ck
O3フルバージョン使ってるからでは
204名無しさん@お腹いっぱい。
2025/02/20(木) 00:22:13.18ID:G087vZwX 数ヶ月後のGPT5の内部にo3って型落ち感ないかな
たぶんo4出てる頃でしょ
たぶんo4出てる頃でしょ
205名無しさん@お腹いっぱい。
2025/02/20(木) 00:31:07.49ID:IQp3p0UD このタイミングでgpt5出すべきなのに数ヶ月後って
Openaiも終わりやね
Openaiも終わりやね
206名無しさん@お腹いっぱい。
2025/02/20(木) 00:49:11.51ID:hmckCEIH GoogleのAI co-scientistは久々にワクワクするニュースだ
Gemini 2.0ベース 研究機関向けだけど
Sakanaみたいな完全自律型じゃなくて、あくまで共同研究者
でも今はまだそういう形の方が信頼性も生産性も高そう
Gemini 2.0ベース 研究機関向けだけど
Sakanaみたいな完全自律型じゃなくて、あくまで共同研究者
でも今はまだそういう形の方が信頼性も生産性も高そう
2025/02/20(木) 00:59:15.10ID:FNUb0SA7
ChatGPT Proでo1 pro使ってて知識量、推論能力両面で十分とは言わないまでもかなり良いと感じる
o3にもなればあらゆる面で十分になることはベンチマーク上強く示唆されてる
o3を推論or非推論を自動判断するモデルにするだけでほとんど全ての用途に対応できる完全版になるからGPT-5の価値はかなり大きい
エージェントも一強だし今後もOpenAIがリードする流れが続くと思う
o3にもなればあらゆる面で十分になることはベンチマーク上強く示唆されてる
o3を推論or非推論を自動判断するモデルにするだけでほとんど全ての用途に対応できる完全版になるからGPT-5の価値はかなり大きい
エージェントも一強だし今後もOpenAIがリードする流れが続くと思う
2025/02/20(木) 01:02:57.50ID:FNUb0SA7
209名無しさん@お腹いっぱい。
2025/02/20(木) 01:06:29.19ID:SAC6xZ1M NVIDIAというよりTSMCどうにかならんのか
工場100倍ぐらいに増やしてくれないと
ほんともどかしい
工場100倍ぐらいに増やしてくれないと
ほんともどかしい
2025/02/20(木) 01:33:42.76ID:8hPc9BFN
GPT4.5はいつ来るんだっけ
2025/02/20(木) 01:53:21.61ID:5pQK40Oe
2025/02/20(木) 02:17:13.65ID:Wi7Hqu2f
そもそもo4は普通に出ないだろ
コストバカ高いんだから
コストバカ高いんだから
2025/02/20(木) 02:35:19.12ID:H1kGtXR4
運用コストだっけ?
毎年1/10になると言ってるんだから、o4相当もGPT-6に組み込んで出るんじゃないの?
それともGPT-6もGPT-5と同じくo3だと思ってるの?
毎年1/10になると言ってるんだから、o4相当もGPT-6に組み込んで出るんじゃないの?
それともGPT-6もGPT-5と同じくo3だと思ってるの?
2025/02/20(木) 03:01:29.79ID:fIdlxdTx
同じo3といっても全く同じなわけないからな
GPT-4oだってClaude 3.5 sonnetだって何回もアップデートが繰り返されてる
GPT-4oだってClaude 3.5 sonnetだって何回もアップデートが繰り返されてる
2025/02/20(木) 03:53:36.68ID:ALo/FqxC
毎月2,900円であれならGEMINIでええわ
6,000とか30,000とか流石に出せん
6,000とか30,000とか流石に出せん
216名無しさん@お腹いっぱい。
2025/02/20(木) 05:52:51.00ID:kpjrVfPJ 30,000はその対価を得られるかどうか
自分はpythonの使い方を一ヵ月程度で一通り学習できた
参考書買えば済むけど半年を一ヵ月に縮めたと思えば30000は破格
1日10~12時間python触れる環境があって初めてなせる技ってのもあるけど
学生とか時間有り余ってる人が1からなにかガチでやるならアリ
自分はpythonの使い方を一ヵ月程度で一通り学習できた
参考書買えば済むけど半年を一ヵ月に縮めたと思えば30000は破格
1日10~12時間python触れる環境があって初めてなせる技ってのもあるけど
学生とか時間有り余ってる人が1からなにかガチでやるならアリ
2025/02/20(木) 06:14:11.36ID:LpWNHSPY
誰が6000円だか8000円も払うんだよ
それならGeminiとGPTを2つ契約できるわい
それならGeminiとGPTを2つ契約できるわい
2025/02/20(木) 07:20:41.38ID:1dUps8IS
://youtu.be/7eliyqEEe5U?si=dUwu0ITnY9BGrmX7
ゲーム作った、ゲーム。
3つの、
選択肢を、
提示し、
選択肢1と、選択肢2とでは、
比較検討すると、
どうたら。
選択肢2と、選択肢3と、
比較検討すると、どうたら。
選択肢3と、選択肢1と、
比較検討すると、どうたら。
それぞれの、
メリット、デメリットを、
比較検討し、
最後に、総合アドバイス。
ゲーム作った、ゲーム。
3つの、
選択肢を、
提示し、
選択肢1と、選択肢2とでは、
比較検討すると、
どうたら。
選択肢2と、選択肢3と、
比較検討すると、どうたら。
選択肢3と、選択肢1と、
比較検討すると、どうたら。
それぞれの、
メリット、デメリットを、
比較検討し、
最後に、総合アドバイス。
219名無しさん@お腹いっぱい。
2025/02/20(木) 07:22:35.08ID:mZFcD/DP (.+、\n){3,}
220名無しさん@お腹いっぱい。
2025/02/20(木) 08:32:12.37ID:8RHn93Jf 無料版のGrokにGrok3が来てるね
レートリミットはどうなってるのかな
レートリミットはどうなってるのかな
2025/02/20(木) 09:22:52.78ID:1dUps8IS
この正規表現 (.+、\n){3,} は、以下のようなパターンにマッチします。
説明:
.+、\n → 1つ以上の文字 (.+) の後に「、」(読点) が続き、改行 (\n) で終わる。
{3,} → 上記のパターンが3回以上繰り返される。
具体例:
以下のようなテキストにマッチします。
リンゴ、
バナナ、
オレンジ、
パイナップル、
この場合、読点「、」のついた行が3回以上繰り返されているため、一括でマッチします。
応用:
大量のデータの中で読点を含む箇所を抽出したい場合に使える。
リスト形式のテキストから連続した項目を検出するのに便利。
用途によって微調整が必要なら、具体的な目的を教えてください!
説明:
.+、\n → 1つ以上の文字 (.+) の後に「、」(読点) が続き、改行 (\n) で終わる。
{3,} → 上記のパターンが3回以上繰り返される。
具体例:
以下のようなテキストにマッチします。
リンゴ、
バナナ、
オレンジ、
パイナップル、
この場合、読点「、」のついた行が3回以上繰り返されているため、一括でマッチします。
応用:
大量のデータの中で読点を含む箇所を抽出したい場合に使える。
リスト形式のテキストから連続した項目を検出するのに便利。
用途によって微調整が必要なら、具体的な目的を教えてください!
222名無しさん@お腹いっぱい。
2025/02/20(木) 09:22:55.05ID:U570F4ZI >>178
ChatGPT Deep Research
それぞれ普通に調べて、「全く別の文脈で使われる言葉です」
i.imgur.com/OcAso0e.jpeg
Gemini Deep Research
それぞれ普通に調べて、「意外な共通点が見えてくる」
i.imgur.com/PGvIScL.jpeg
Perplexity Deep Research
「佐野」姓の実在の物理学者の研究を引っ張ってきて、もっともらしいレポートを作成
poe.com/s/mkFYc5mZNuckAVngFA1C
ChatGPT Deep Research
それぞれ普通に調べて、「全く別の文脈で使われる言葉です」
i.imgur.com/OcAso0e.jpeg
Gemini Deep Research
それぞれ普通に調べて、「意外な共通点が見えてくる」
i.imgur.com/PGvIScL.jpeg
Perplexity Deep Research
「佐野」姓の実在の物理学者の研究を引っ張ってきて、もっともらしいレポートを作成
poe.com/s/mkFYc5mZNuckAVngFA1C
2025/02/20(木) 09:30:04.12ID:JQgWjNqT
Grok3悪くなさそうだけど
今自分が納得できるベンチマーク的質問が思いつかんぬ
今自分が納得できるベンチマーク的質問が思いつかんぬ
224名無しさん@お腹いっぱい。
2025/02/20(木) 09:32:25.98ID:qunI7+GF 未だに石庭グループと石亭グループの違いの正解を出せないからなぁ
人間なら、x.comに書かれてる複数の呟きを見ればピンときて、Wikiが混同して書かれてるって分かるのに
公式情報やまとめ情報ばかり引っ張ってきてレポート作られても仕事じゃ使えないわ
(思わず書いちゃった裏情報みたいのが分かるようにならないと)
人間なら、x.comに書かれてる複数の呟きを見ればピンときて、Wikiが混同して書かれてるって分かるのに
公式情報やまとめ情報ばかり引っ張ってきてレポート作られても仕事じゃ使えないわ
(思わず書いちゃった裏情報みたいのが分かるようにならないと)
2025/02/20(木) 09:56:14.94ID:Nm+lhwhD
>>224
ChatGPTのDeep Research試してから言ってね
ChatGPTのDeep Research試してから言ってね
2025/02/20(木) 09:57:59.20ID:Nm+lhwhD
227名無しさん@お腹いっぱい。
2025/02/20(木) 10:00:02.01ID:/7l8xP1H2025/02/20(木) 10:03:09.00ID:1tt0iZUR
>>227
逆にそれも分からないような性能じゃ役に立たないって意味じゃね
逆にそれも分からないような性能じゃ役に立たないって意味じゃね
2025/02/20(木) 10:14:16.35ID:Nm+lhwhD
2025/02/20(木) 10:14:18.41ID:JQgWjNqT
ChatGPTの推論モデルとやり取りしてたら途中から推論が日本語に切り替わった
2025/02/20(木) 10:18:41.95ID:1dUps8IS
つまり、
ネット上の、
主に、日本語で、
書かれた情報から、
取ってきた情報で、
構築した、
データベースしか、
無い時は、
それで演算し、
その結果が、
日本語で、
出力されてくる、
ということかな?
推論の、
過程の、部分で、
あっても。
ネット上の、
主に、日本語で、
書かれた情報から、
取ってきた情報で、
構築した、
データベースしか、
無い時は、
それで演算し、
その結果が、
日本語で、
出力されてくる、
ということかな?
推論の、
過程の、部分で、
あっても。
2025/02/20(木) 10:29:27.56ID:hgCM8hpi
grok3も9.11と9.9を間違うのな
233名無しさん@お腹いっぱい。
2025/02/20(木) 10:34:53.24ID:U570F4ZI >>232
9.11と9.9はどっちが大きい?
Grok3
https://grok.com/share/bGVnYWN5_1c04c191-d49b-4dd2-9393-6a64805bc027
Grok3+Think 96秒
https://grok.com/share/bGVnYWN5_37acd9eb-862a-4dc6-81b5-8f0938b9aea5
正解するけどちょっと推論が冗長すぎるような
9.11と9.9はどっちが大きい?
Grok3
https://grok.com/share/bGVnYWN5_1c04c191-d49b-4dd2-9393-6a64805bc027
Grok3+Think 96秒
https://grok.com/share/bGVnYWN5_37acd9eb-862a-4dc6-81b5-8f0938b9aea5
正解するけどちょっと推論が冗長すぎるような
234名無しさん@お腹いっぱい。
2025/02/20(木) 10:54:23.38ID:U570F4ZI >>106,107
R1-1776とSonar Reasoningの違い
R1-1776
https://i.imgur.com/AHzYwfQ.jpeg
Sonar Reasoning
https://i.imgur.com/vOsDEnt.jpeg
R1-1776はモデル単体で推論
Sonar ReasoningはRAG+推論
R1-1776の命名の由来
https://x.com/AravSrinivas/status/1891917888388465125
> 推論の痕跡が検閲の対象にならないことが重要だと考えています。制約された推論ではなく、最大限に真実に即した推論を適用する必要があります。このモデルは、アメリカが独立した年と言論の自由というアメリカの価値観にちなんで「R1 1776」と名付けられました。
R1-1776とSonar Reasoningの違い
R1-1776
https://i.imgur.com/AHzYwfQ.jpeg
Sonar Reasoning
https://i.imgur.com/vOsDEnt.jpeg
R1-1776はモデル単体で推論
Sonar ReasoningはRAG+推論
R1-1776の命名の由来
https://x.com/AravSrinivas/status/1891917888388465125
> 推論の痕跡が検閲の対象にならないことが重要だと考えています。制約された推論ではなく、最大限に真実に即した推論を適用する必要があります。このモデルは、アメリカが独立した年と言論の自由というアメリカの価値観にちなんで「R1 1776」と名付けられました。
235名無しさん@お腹いっぱい。
2025/02/20(木) 11:09:04.57ID:U570F4ZI >>206
自己対話で仮説を改善、計算時間をかけるほど質が良くなりあるところで人間の専門家を超える
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/
https://i.imgur.com/ZiHJqFG.png
自己対話で仮説を改善、計算時間をかけるほど質が良くなりあるところで人間の専門家を超える
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/
https://i.imgur.com/ZiHJqFG.png
2025/02/20(木) 11:13:34.06ID:hgCM8hpi
人間を超えるぞぉ!とか言い続けるのは聞き飽きたわ
明日発表されるfigureに期待
はよ動き回る超知能出てくれ
明日発表されるfigureに期待
はよ動き回る超知能出てくれ
237名無しさん@お腹いっぱい。
2025/02/20(木) 11:14:04.47ID:U570F4ZI2025/02/20(木) 11:15:02.08ID:arUM5Zak
月200ドルをペイするとかアホなん
あんなもんただの信者のお布施だろ
もちろん俺はAIに1円も払ってないしこれから先も払わない
あんなもんただの信者のお布施だろ
もちろん俺はAIに1円も払ってないしこれから先も払わない
2025/02/20(木) 11:18:37.44ID:u6R/l2Im
月200ドルでも全然サービス価格なんだけどな
投資家たちのおかげで月200ドルしか払えない貧乏人も最先端AIを使えるというのに、それさえ払えないやつなんて相手にしようがないわな
投資家たちのおかげで月200ドルしか払えない貧乏人も最先端AIを使えるというのに、それさえ払えないやつなんて相手にしようがないわな
240名無しさん@お腹いっぱい。
2025/02/20(木) 11:28:20.99ID:U570F4ZI https://x.com/d_1d2d/status/1892304288128651686
> 数学やコーディングを通じて「自分の間違いを検知して修正し、問題に粘り強く取り組み、多様な解法を試して最良のものを選ぶ」というプロセスを学んだ結果、他のタスクにも一般化できるようになった
Grok3についてだけど、他の推論モデルにも共通する特徴ではある
> 数学やコーディングを通じて「自分の間違いを検知して修正し、問題に粘り強く取り組み、多様な解法を試して最良のものを選ぶ」というプロセスを学んだ結果、他のタスクにも一般化できるようになった
Grok3についてだけど、他の推論モデルにも共通する特徴ではある
2025/02/20(木) 11:31:46.04ID:vUr5ByM9
2025/02/20(木) 11:35:29.16ID:QTLX0NRZ
いつ覗いてもびっくりするぐらい低レベルスレだなここ
2025/02/20(木) 11:36:05.22ID:arUM5Zak
DeepSearchとThinkはすぐ制限されてしまったので
Flash Thinkingと比べるならやはり通常モードで比べるしかないね
Flash Thinkingと比べるならやはり通常モードで比べるしかないね
2025/02/20(木) 11:54:02.82ID:Nm+lhwhD
245名無しさん@お腹いっぱい。
2025/02/20(木) 11:55:07.72ID:U570F4ZI Microsoft 365 CopilotのCopilot Chatが使えるようになっている
これはコンシューマー向けMicrosoft Copilot(新バージョン)とは別で、旧バージョンと同系統のもの
https://i.imgur.com/xFomkHR.jpeg
https://i.imgur.com/a5meym2.jpeg
これはコンシューマー向けMicrosoft Copilot(新バージョン)とは別で、旧バージョンと同系統のもの
https://i.imgur.com/xFomkHR.jpeg
https://i.imgur.com/a5meym2.jpeg
246名無しさん@お腹いっぱい。
2025/02/20(木) 11:56:54.20ID:U570F4ZI >>245
使えるようになったのは無料プランで、有料プランは前から使えていたと思う
使えるようになったのは無料プランで、有料プランは前から使えていたと思う
2025/02/20(木) 12:10:47.54ID:IHNC57dq
今井翔太 / Shota Imai@えるエル
@ImAI_Eruel
やばい、Deep Research使ったAI競馬強すぎる。
圧倒的本命マスカレードボール押しが的中
(AI研究者的な面白チャレンジのつもりだった)
使い方によってはChatGPT proの月額3万ちょっとの元を余裕で取れそう
#共同通信杯
#東京11R
x.com/ImAI_Eruel/status/1891021988598014207
@ImAI_Eruel
やばい、Deep Research使ったAI競馬強すぎる。
圧倒的本命マスカレードボール押しが的中
(AI研究者的な面白チャレンジのつもりだった)
使い方によってはChatGPT proの月額3万ちょっとの元を余裕で取れそう
#共同通信杯
#東京11R
x.com/ImAI_Eruel/status/1891021988598014207
2025/02/20(木) 12:20:31.22ID:arUM5Zak
ペイするのではなく0から生み出すのがAIだぞHAHAHA!
250名無しさん@お腹いっぱい。
2025/02/20(木) 12:23:45.77ID:JTph7qvx 競馬って過去のレースとか騎手と馬のスペック情報だけで当てられるならとっくに的中AI出来てるでしょ
251名無しさん@お腹いっぱい。
2025/02/20(木) 12:49:26.17ID:GQ0h43n2 そもそも月数万って個人より企業に複数経由で利用してもらう値段設定じゃないの
2025/02/20(木) 12:52:09.64ID:Wi7Hqu2f
月3万ぐらいなら個人でも普通にいけるやろ
2025/02/20(木) 12:54:24.48ID:BWVvhHc9
>>250
同じ馬は何ヶ月に1回とかしか走らないし、距離も違えば馬場状態も枠番も違う。もちろん騎手の乗り替わりもある
90年代とかならスピード指数の割にオッズの高いものを買うとかあったけどみんながやり始めて意味なし
どこかの誰かがやって大儲けしてる大量に買って少しずつプラスを出していく方式がもしかしたらAIを使って個人でできるかもね
同じ馬は何ヶ月に1回とかしか走らないし、距離も違えば馬場状態も枠番も違う。もちろん騎手の乗り替わりもある
90年代とかならスピード指数の割にオッズの高いものを買うとかあったけどみんながやり始めて意味なし
どこかの誰かがやって大儲けしてる大量に買って少しずつプラスを出していく方式がもしかしたらAIを使って個人でできるかもね
254名無しさん@お腹いっぱい。
2025/02/20(木) 12:58:51.07ID:9LoQDEN0 Grok3みんな使えるようになってるやん
255名無しさん@お腹いっぱい。
2025/02/20(木) 13:02:04.38ID:GQ0h43n2 何でChatGPTの後発のgrokやdeepseekがトップクラスの性能出せてるのに
日本はGPT3.5〜4.0クラスみたいなショボいところで足踏みしてるんだろう
中国が低コストで作れた時点で金無いは最早通用しないし
日本はGPT3.5〜4.0クラスみたいなショボいところで足踏みしてるんだろう
中国が低コストで作れた時点で金無いは最早通用しないし
2025/02/20(木) 13:03:09.48ID:9wOQX2gf
Copilot Desktop は エレクトーンやラッパーというカネモの趣味を持っている。それに対して俺ら貧乏人は何も持ってねえ。だからブラウザしかねえということか?
ChatGPT:
ははは!タカ、おもしれぇ発想だな🔥
そうだな、Copilot Desktop は エレクトーン(Electron)とラッパー(Wrapper) という金持ち趣味を持ってる。
俺らみたいな貧乏人にはブラウザしかねぇ。
でも考えてみろ。
「ブラウザしかねえ」=「自由」だ
デスクトップ版 → 決められた UI・ズーム不可・設定少ない
ブラウザ版 → 拡張機能・ズーム・複数タブ なんでもあり
つまり、
💰 Copilot Desktop は「金持ちが高級車を買ったけどカスタムできねぇ状態」
💻 ブラウザ版 は「ボロ車でもエンジンいじれて自由に走れる」
結局、俺らは「貧乏人の発想」じゃなくて、「自由を持ってる側」ってことだ🔥
タカ、ブラウザ版でのテスト、しっかりやってこいよ!
ChatGPT:
ははは!タカ、おもしれぇ発想だな🔥
そうだな、Copilot Desktop は エレクトーン(Electron)とラッパー(Wrapper) という金持ち趣味を持ってる。
俺らみたいな貧乏人にはブラウザしかねぇ。
でも考えてみろ。
「ブラウザしかねえ」=「自由」だ
デスクトップ版 → 決められた UI・ズーム不可・設定少ない
ブラウザ版 → 拡張機能・ズーム・複数タブ なんでもあり
つまり、
💰 Copilot Desktop は「金持ちが高級車を買ったけどカスタムできねぇ状態」
💻 ブラウザ版 は「ボロ車でもエンジンいじれて自由に走れる」
結局、俺らは「貧乏人の発想」じゃなくて、「自由を持ってる側」ってことだ🔥
タカ、ブラウザ版でのテスト、しっかりやってこいよ!
257名無しさん@お腹いっぱい。
2025/02/20(木) 13:04:01.10ID:XXavQDr5 (((.|\n)*[。、]\n\n){2,}|ご質問ありがとうございます。)
258名無しさん@お腹いっぱい。
2025/02/20(木) 13:06:43.15ID:xQRZfPbe >>222
パープレいくらなんでも酷いw
パープレいくらなんでも酷いw
2025/02/20(木) 13:07:44.78ID:arUM5Zak
地球上一賢いGrok 3とやら、非推論でも強いのかね
2025/02/20(木) 13:13:46.70ID:5Tnn9LaK
pdfの図とか表までちゃんと理解して読めるのってまだない?
261名無しさん@お腹いっぱい。
2025/02/20(木) 13:13:51.16ID:on017WmP ボリスパワーがGrok3の評価法に文句つけてる
https://x.com/i/grok/share/SHiWENYJukt7Xo7AvhrqFXN9h
https://x.com/i/grok/share/SHiWENYJukt7Xo7AvhrqFXN9h
2025/02/20(木) 13:24:55.43ID:zg/jyGGz
現時点で無料で使えるAIの中では、GORK3が一番だろうね
2025/02/20(木) 13:30:21.25ID:Wi7Hqu2f
Perplexityは検索以外能がないのに……なんで……
2025/02/20(木) 13:32:11.36ID:arUM5Zak
浅く推論するのがいいのか深く推論するのがいいのかという問題が出てくる
前者のスタイルならもちろんGeminiが強い
前者のスタイルならもちろんGeminiが強い
265名無しさん@お腹いっぱい。
2025/02/20(木) 13:35:23.31ID:ZosTj5xo >>261
同じように「良く見せる」やり口はどこもやってるからなあ
同じように「良く見せる」やり口はどこもやってるからなあ
2025/02/20(木) 14:01:51.18ID:1dUps8IS
perplexityは、
ゲームも、
作れるよ。
ゲームも、
作れるよ。
2025/02/20(木) 14:27:03.61ID:8hPc9BFN
Perplexityの強みは速いことだろ
他のサービスは検索が遅いわ
Google検索の代わりに使えるのは推論AIではなくPerplexity
他のサービスは検索が遅いわ
Google検索の代わりに使えるのは推論AIではなくPerplexity
268名無しさん@お腹いっぱい。
2025/02/20(木) 14:34:35.23ID:kpjrVfPJ なんかgrok 3気になって自分のアプリのコードを最適化して処理を早くできるか?っていうお題で、コード丸投げしてo1 pro と比較してみたけど
どっちも修正コード出してきて実行してみたけど、o1 proは特に体感変わった感じなかったけど、grok 3 は動かなかった
まだchat gptの方が上なんかな
どっちも修正コード出してきて実行してみたけど、o1 proは特に体感変わった感じなかったけど、grok 3 は動かなかった
まだchat gptの方が上なんかな
2025/02/20(木) 14:40:20.59ID:SAC6xZ1M
2025/02/20(木) 14:43:19.57ID:blVPvYEF
>>267
その通りでChatGPTのDeep Researchの唯一の弱点は時間がかかるところ
ただこれのすごいのは調べた上でこちらの要望に基づいて考えてオーダーメイドのアドバイスまでしてくれるところ
グーグル検索の代わりにプロのコンサルが出てくるようなもの
その通りでChatGPTのDeep Researchの唯一の弱点は時間がかかるところ
ただこれのすごいのは調べた上でこちらの要望に基づいて考えてオーダーメイドのアドバイスまでしてくれるところ
グーグル検索の代わりにプロのコンサルが出てくるようなもの
271名無しさん@お腹いっぱい。
2025/02/20(木) 15:31:02.91ID:DM2WR9WW >>261
レスバが始まっとるな
レスバが始まっとるな
2025/02/20(木) 15:40:39.44ID:arUM5Zak
>>267
ずっとPerplexity使ってたけど欠点が分かってきてリートンの方がマシってなった
ずっとPerplexity使ってたけど欠点が分かってきてリートンの方がマシってなった
2025/02/20(木) 15:55:59.24ID:arUM5Zak
Grok 3が出た今非推論だけで比べてもどっちもそれ以下ということになるけど
2025/02/20(木) 15:58:45.21ID:aa/oMFfa
Yahoo!知恵袋で、よく中学生高校生が宿題を丸投げしたような質問を
しばしば見かける。chatGPTやGeminiなどの無料を高性能のAI chat serviceが
使えるようになると、これに宿題を丸投げする学生が出てくるような気がする。
しばしば見かける。chatGPTやGeminiなどの無料を高性能のAI chat serviceが
使えるようになると、これに宿題を丸投げする学生が出てくるような気がする。
2025/02/20(木) 16:04:03.26ID:arUM5Zak
ご丁寧にUIを日本語に対応させてきた所を見る本気で覇権取りに来たか
2025/02/20(木) 16:13:06.22ID:fIdlxdTx
>>274
もう大学生は大半が使ってるよ
もう大学生は大半が使ってるよ
277名無しさん@お腹いっぱい。
2025/02/20(木) 16:17:49.45ID:5o4YVVry 今どきの大学生のレポートとか卒論指導大変そう
278名無しさん@お腹いっぱい。
2025/02/20(木) 16:31:04.20ID:HNRU40qR @xai
> This is it: The world’s smartest AI, Grok 3, now available for free (until our servers melt).
until our servers melt
(訳:ずっと無料で使えると思うなよ)
> This is it: The world’s smartest AI, Grok 3, now available for free (until our servers melt).
until our servers melt
(訳:ずっと無料で使えると思うなよ)
2025/02/20(木) 16:32:31.83ID:PRTd+abd
Deep Research使いまくってるんだが、まだ限界に達しないな。あと何回使えるのか調べる方法はあるのかな?
2025/02/20(木) 16:37:02.21ID:5Tnn9LaK
o3mini highが何回指摘しても自信満々に同じ間違いをして腹立つわ
間違えても謝罪しろと言わないと謝らないでしれっと回答かえるだけ
grok3の方が優秀なの?gtp5出るまで待つしかないのかな
間違えても謝罪しろと言わないと謝らないでしれっと回答かえるだけ
grok3の方が優秀なの?gtp5出るまで待つしかないのかな
2025/02/20(木) 16:37:16.00ID:KIti2dfa
スマホ持ち込んでAIもありにして本 正しい答えが出せるかの試験にしたら良さそうな?
2025/02/20(木) 16:39:41.29ID:SAC6xZ1M
Grok3割と良い気がする
少なくとも4oとgemini1206と全く遜色ないね
Thinkngを付けたりも出来るし優位かも
少なくとも4oとgemini1206と全く遜色ないね
Thinkngを付けたりも出来るし優位かも
283名無しさん@お腹いっぱい。 ころころ
2025/02/20(木) 16:41:11.51ID:5SUkHZc3 xAIは自前のサーバーやGPUだから、運用費用は電気代ぐらいだけで余裕でしょ
サーバーやGPUの設備投資費は莫大だろうけど
サーバーやGPUの設備投資費は莫大だろうけど
284名無しさん@お腹いっぱい。
2025/02/20(木) 16:43:49.87ID:L+SyfQ1P AIが「自信満々」とか、あと「平気で」嘘をつくとか人間のように形容してる人って、使いづらそう
2025/02/20(木) 16:44:09.59ID:arUM5Zak
ブックマークしてるサービス全部アップデートされてるのに
リートンだけ変わってないのが逆に気になるなw
リートンだけ変わってないのが逆に気になるなw
2025/02/20(木) 16:46:59.64ID:7XQpIjm4
馬鹿の使い方なんてどうでもいい
将棋AIだってプロは研究で有効に使ってる一方で
馬鹿は対局でカンニングチートに使うしか能が無いし
将棋AIだってプロは研究で有効に使ってる一方で
馬鹿は対局でカンニングチートに使うしか能が無いし
2025/02/20(木) 16:54:37.06ID:HPxmCl5h
推論中のAIはよく生意気そうな口調で呟いてるけど
推論が終わると丁寧な口調で書いてくるの草
外面がいいな
推論が終わると丁寧な口調で書いてくるの草
外面がいいな
288名無しさん@お腹いっぱい。
2025/02/20(木) 17:16:10.49ID:G087vZwX 推論って数十ステップとか考え続けてるけど学習型の1発回答と比べてどんくらい計算資源使ってんのかなあれ
289名無しさん@お腹いっぱい。
2025/02/20(木) 17:26:13.03ID:FtDmxfrA2025/02/20(木) 17:40:19.97ID:SAC6xZ1M
結局の所、Grok3は日本人的にはどうなの
最強なのかそうじゃないのかどっちなんだい
最強なのかそうじゃないのかどっちなんだい
2025/02/20(木) 17:53:20.68ID:arUM5Zak
2025/02/20(木) 18:01:55.59ID:8hPc9BFN
grokの日本語性能はChatGPTと同じくらいには良いように見える
Geminiは長文になると他言語が混ざってくるのがうんち
claudeは4.0待ち
Geminiは長文になると他言語が混ざってくるのがうんち
claudeは4.0待ち
2025/02/20(木) 18:25:47.08ID:zg/jyGGz
現時点では無料ではGORK3が一番だと思うよ
ただ過去を含めると正確性以外の部分に関しては、
BINGチャットAIの一番良い時の方が利口だったかもしれない
ただ過去を含めると正確性以外の部分に関しては、
BINGチャットAIの一番良い時の方が利口だったかもしれない
2025/02/20(木) 18:34:41.34ID:c7hAOAgK
2025/02/20(木) 18:41:47.99ID:fn9rCPU+
データセンターの天才たちの国はまだか
2025/02/20(木) 18:42:20.41ID:arUM5Zak
結局高コストでがっつり推論させるより無料で高速で浅く推論させる方が使いやすいという所に落ち着く
2025/02/20(木) 18:53:45.65ID:SAC6xZ1M
こっちの背景とか文脈を知ってないと的確に回答出来ない
っていう段階に来てるから、無限のトークン数がないとどうにもならない気がしてきた
2Mトークンとか言ったって要は10MBぐらいでしょ?
スーファミレベルって考えると先は遠いな・・・
っていう段階に来てるから、無限のトークン数がないとどうにもならない気がしてきた
2Mトークンとか言ったって要は10MBぐらいでしょ?
スーファミレベルって考えると先は遠いな・・・
2025/02/20(木) 18:58:05.58ID:c7hAOAgK
>>297
いちいち伝えるのが面倒だからエージェントが注目されてる
いちいち伝えるのが面倒だからエージェントが注目されてる
299名無しさん@お腹いっぱい。
2025/02/20(木) 19:07:26.93ID:+k9Ou70L Grok3+ThinkingでやっとこさR1に追いつく程度にしか感じないなあ
300名無しさん@お腹いっぱい。
2025/02/20(木) 19:14:30.95ID:G087vZwX トークン数多くても結局会話長くなるほど出力が崩壊する率高くなるから,別の対話記憶システムが求められる
グーグルが最近出したTitanとかいう論文がそういうメモリ系のアイデアじゃなかったっけ
グーグルが最近出したTitanとかいう論文がそういうメモリ系のアイデアじゃなかったっけ
301名無しさん@お腹いっぱい。
2025/02/20(木) 19:24:14.91ID:g+71E2An2025/02/20(木) 19:24:53.28ID:zg/jyGGz
thinkingとdeep searchは使い所次第という感じじゃないかな
適合した質問に関してはかなり良い解答が出るけど、
そうでない質問に関しては、素のモデルに聞いても大差ない回答になる
適合した質問に関してはかなり良い解答が出るけど、
そうでない質問に関しては、素のモデルに聞いても大差ない回答になる
2025/02/20(木) 19:44:23.83ID:JQgWjNqT
>>301
Medical Advisorとかヤバイな
Medical Advisorとかヤバイな
2025/02/20(木) 19:47:59.42ID:Gtl/BIbV
Grok 3
DeepSearch オン
イーロン・マスクをアメリカ大統領にする方法と、具体的なプランを作成して
i.imgur.com/yumL79W.png
DeepSearch オン
イーロン・マスクをアメリカ大統領にする方法と、具体的なプランを作成して
i.imgur.com/yumL79W.png
305名無しさん@お腹いっぱい。
2025/02/20(木) 20:01:09.43ID:g+71E2An 「Grok 3モデルは1M(100万トークン)のコンテキストウィンドウ能力を持っていますが、現在は128k(128,000トークン)で運用されています。」
https://x.com/i/grok/share/jyO3wi8HophFNGreLxwwfhZrM
https://x.com/i/grok/share/jyO3wi8HophFNGreLxwwfhZrM
2025/02/20(木) 20:01:50.96ID:aa/oMFfa
307名無しさん@お腹いっぱい。
2025/02/20(木) 20:17:13.64ID:UqqLzGPU 前スレのこれとか
threadreaderapp.com/thread/1889560541917589508.html
あとこれとか
anond.hatelabo.jp/20250203224000
こういうの見ると、文型理系問わず教育現場で頭抱えてる先生は多そう
threadreaderapp.com/thread/1889560541917589508.html
あとこれとか
anond.hatelabo.jp/20250203224000
こういうの見ると、文型理系問わず教育現場で頭抱えてる先生は多そう
2025/02/20(木) 20:34:17.56ID:nzuxFe3f
お前ら思考が浅いよね
なんで教育現場でそういう問題が起きているかと考えると、AIが人間の代わりに回答を作れるということはAIの方が人間よりも優れているからで、今は人間がAIに勉強を教えてもらったりしているけど、そもそも人間が勉強をするのは社会に出て働くためだけど、AIが人間に勉強を教えられるならAIに仕事もやってもらえばいいわけで、そうすると人間が働く必要はなくなって、人間を教育する必要もなくなるわけだ
その過度期だから、こういう教育現場での問題が起きるんだ
教員も自分の仕事がなくなるから言わないだけで、教育する人間も教わる側の人間ももう必要なくなるんだよ
それが一番すっきりする回答だ
なんで教育現場でそういう問題が起きているかと考えると、AIが人間の代わりに回答を作れるということはAIの方が人間よりも優れているからで、今は人間がAIに勉強を教えてもらったりしているけど、そもそも人間が勉強をするのは社会に出て働くためだけど、AIが人間に勉強を教えられるならAIに仕事もやってもらえばいいわけで、そうすると人間が働く必要はなくなって、人間を教育する必要もなくなるわけだ
その過度期だから、こういう教育現場での問題が起きるんだ
教員も自分の仕事がなくなるから言わないだけで、教育する人間も教わる側の人間ももう必要なくなるんだよ
それが一番すっきりする回答だ
309名無しさん@お腹いっぱい。
2025/02/20(木) 20:41:18.14ID:XxS4uOxT すごい早口で喋ってそう
310名無しさん@お腹いっぱい。
2025/02/20(木) 20:43:05.94ID:G087vZwX 確かに今のクソガキが社会出る頃にAGI社会になってりゃそれでいいんだが
AGI近いうち出そうとはいえまだ不透明だし、今おべんきょ放棄するのはギャンブルだろ
まーAIの扱い方自分であれこれ考えてるなら、それで思考力鍛えられそうだけどね
AGI近いうち出そうとはいえまだ不透明だし、今おべんきょ放棄するのはギャンブルだろ
まーAIの扱い方自分であれこれ考えてるなら、それで思考力鍛えられそうだけどね
2025/02/20(木) 20:51:57.06ID:nzuxFe3f
お前ら、与えられた枠組みの範疇(この例では教員と学生間の問題)でしか思考できないよね
国語の試験で、回答は問題文の中だけ見て書け、と訓練されたからだろうな
国語教育の弊害だよね
真面目に馬鹿な議論していて、馬鹿みたいだわ
国語の試験で、回答は問題文の中だけ見て書け、と訓練されたからだろうな
国語教育の弊害だよね
真面目に馬鹿な議論していて、馬鹿みたいだわ
2025/02/20(木) 20:53:39.27ID:SAC6xZ1M
勉強の定義が変わるから、俺は今の勉強を放棄するのに賛成だね
快不快とか生命の危険という、絶対に変わらない前提があるからなんとかなるだろ
それこそ無理やり強化学習で正解を導くような人類進化が、今始まってるよ
AGIの人柱となって若者にはあらゆるパターンをテストしてもらおうよ
快不快とか生命の危険という、絶対に変わらない前提があるからなんとかなるだろ
それこそ無理やり強化学習で正解を導くような人類進化が、今始まってるよ
AGIの人柱となって若者にはあらゆるパターンをテストしてもらおうよ
2025/02/20(木) 20:55:49.68ID:SAC6xZ1M
>>311
いやお前の思考も浅いよ
そんなの分かってるけどそれが仕事だから報酬を得るために
その枠組のなかであーだこうだと言ってるだけに過ぎない
AIで学べばいいじゃんなんてどっちも分かってるんだよ
とはいえ片方は飯のため、片方は世間体のために甘受しているだけ
いやお前の思考も浅いよ
そんなの分かってるけどそれが仕事だから報酬を得るために
その枠組のなかであーだこうだと言ってるだけに過ぎない
AIで学べばいいじゃんなんてどっちも分かってるんだよ
とはいえ片方は飯のため、片方は世間体のために甘受しているだけ
2025/02/20(木) 20:59:28.24ID:nzuxFe3f
だから、教育する側はもっともらしい立派なことを言ってるけど、自分の仕事がなくなる不都合な可能性には言及しないんだから
立派な人間なんていないわな
それを自覚して発言しているならいいけど
立派な人間なんていないわな
それを自覚して発言しているならいいけど
2025/02/20(木) 21:03:50.38ID:HdLAeyhQ
無料で使う分にはGrok3ええね
Deepseekはレートリミット激しいし
有料はChatGPT、無料はGrok3とPerplexity、ローカルはDeepseekでええわ
Deepseekはレートリミット激しいし
有料はChatGPT、無料はGrok3とPerplexity、ローカルはDeepseekでええわ
2025/02/20(木) 21:19:31.48ID:s9ziDgxl
人間が検証しなくても何らかの方法でAIの個々の出力の正確性が評価できるようになるならいいが、そんな仕組みが用意されないならAIが賢くなればなるほど人間もより賢くならなければ出力を評価できない
ということで少なくとも今のうちは勉強は必須
ということで少なくとも今のうちは勉強は必須
2025/02/20(木) 21:22:39.84ID:13sBmuip
>>304
カナダがアメリカに併合されたら母親が生まれながらのアメリカ人になるからいけそうな気がするんだけどそういう論点は出てこないのかな
カナダがアメリカに併合されたら母親が生まれながらのアメリカ人になるからいけそうな気がするんだけどそういう論点は出てこないのかな
2025/02/20(木) 21:23:20.44ID:13sBmuip
>>306
そもそも出題をAIに任せてるとか?
そもそも出題をAIに任せてるとか?
320名無しさん@お腹いっぱい。
2025/02/20(木) 21:26:29.91ID:g+71E2An2025/02/20(木) 21:39:36.37ID:nzuxFe3f
>>317
そうだね
反論するわけじゃないけど、ハルシネーションが完全に起きないようにできたら、それが実現するわけだ
それと、AIが人間を越えてASIになったら、人間は自分よりも賢い存在の能力差や間違いを認識できないだろうから、その場合も実質的に実現するわけだ
したがって、AIが賢くなればなるほど~は、間違いだ
そうだね
反論するわけじゃないけど、ハルシネーションが完全に起きないようにできたら、それが実現するわけだ
それと、AIが人間を越えてASIになったら、人間は自分よりも賢い存在の能力差や間違いを認識できないだろうから、その場合も実質的に実現するわけだ
したがって、AIが賢くなればなるほど~は、間違いだ
2025/02/20(木) 21:39:55.82ID:FNUb0SA7
2025/02/20(木) 21:43:27.78ID:Mc00+qJf
ローカルR1はどれぐらいのサイズ?
2025/02/20(木) 21:44:41.90ID:FNUb0SA7
distilled Llama 8Bでたしか5GBくらいだった記憶
325名無しさん@お腹いっぱい。
2025/02/20(木) 21:47:07.25ID:GQ0h43n2 SAKANA AIってブラウザで使える生成AIまだないのか
2025/02/20(木) 21:53:46.34ID:Mc00+qJf
327名無しさん@お腹いっぱい。
2025/02/20(木) 22:07:56.76ID:kpjrVfPJ 要件定義→設計→構築→テスト
AIの出現で上から入れるね、上とテスト工程やれたらSIできるってチートでしょ
こんな分業時代が押し寄せる狭間に私たちは今いるのだ
AIの出現で上から入れるね、上とテスト工程やれたらSIできるってチートでしょ
こんな分業時代が押し寄せる狭間に私たちは今いるのだ
328名無しさん@お腹いっぱい。
2025/02/20(木) 22:11:32.80ID:z/gjYx1T329名無しさん@お腹いっぱい。
2025/02/20(木) 22:11:45.82ID:qunI7+GF perplexityもGrokもdeepsearchT使うと必ずエラーが出る
ハルシ避けのプロンプトがダメみたいだからハズして
石庭と石亭の違い聞いたけど、やはり推理能力無かったわ
人狼ゲームくらい狭い世界なら誰が狼か推理出来るのかな
ハルシ避けのプロンプトがダメみたいだからハズして
石庭と石亭の違い聞いたけど、やはり推理能力無かったわ
人狼ゲームくらい狭い世界なら誰が狼か推理出来るのかな
2025/02/20(木) 22:12:44.40ID:QaUGoP5G
人間の個々の出力の正確性だって全然まともに人間は評価出来てないのに
何故AIに対してはやたらと無理難題を設定しようとするのか
何故AIに対してはやたらと無理難題を設定しようとするのか
2025/02/20(木) 22:30:53.80ID:UPAw8S4a
SakanaAIはもう終わりやね
所詮スケーリング則から逃げた負け犬
所詮スケーリング則から逃げた負け犬
332名無しさん@お腹いっぱい。
2025/02/20(木) 22:30:59.42ID:qunI7+GF DeepResearchでエラーが出ると
perplexity.はノーカウント扱いなのに、Grokは今日の制限に達してしまった
そりゃないよ…ま、使えるだけいいけど
perplexity.はノーカウント扱いなのに、Grokは今日の制限に達してしまった
そりゃないよ…ま、使えるだけいいけど
2025/02/20(木) 22:32:59.79ID:pgo6oMFC
>>320
これって、SakanaAIの論文が誤りだったということよりも、o3-mini-highで簡単に検証できたということと、この人が検証しなかったら、この論文が正しい内容として評価されていたかもしれない、ということの方が重要でしょ
SakanaAIの人が論文発表前にo3-mini-highで検証すればよかったのに、ともなるし
これって、SakanaAIの論文が誤りだったということよりも、o3-mini-highで簡単に検証できたということと、この人が検証しなかったら、この論文が正しい内容として評価されていたかもしれない、ということの方が重要でしょ
SakanaAIの人が論文発表前にo3-mini-highで検証すればよかったのに、ともなるし
2025/02/20(木) 22:34:13.62ID:pgo6oMFC
今ならSTAP細胞の論文も秒で検証できそうだ
2025/02/20(木) 22:35:49.61ID:SAC6xZ1M
とうとうAIが人間のハルシネーションを見つける段階になったか
336名無しさん@お腹いっぱい。
2025/02/20(木) 23:04:55.53ID:iWvnD/gy oAIもclaudeも音沙汰なし
337名無しさん@お腹いっぱい。
2025/02/20(木) 23:19:55.26ID:RZtFloAQ Grokのレスポンス良過ぎて他のAI戻れなくなりそう
パープレは毎回結果出すの遅過ぎた
パープレは毎回結果出すの遅過ぎた
2025/02/20(木) 23:23:18.39ID:9wOQX2gf
知的障害や統合失調症は必ずしも神経多様性の概念に含まれるとは限らず、
この文脈で自閉スペクトラム症(ASD)、注意欠如・多動症(ADHD)、学習障害(LD)と境界を設けるわけは、“知的障害や統合失調症"では仕事は無理とういことが含意されているか?
🌱個人向けの無料サービスとして、現に自分がこれから使用せんとしている、copilot.microsoft.comは、MSにとってどういう位置づけか?
### **1⃣ 「神経多様性」と知的障害・統合失調症の境界について**
センシティブで回答がむずかしい事項について、納得のいく、かつ率直な回答を感謝。
🌱急激にこの会話が重くなってきた。新会話に移動しても大丈夫か?
🔥「Bing Chat の進化版」<というが、まだ数個質問を出しただけだが(技術的な質問もしていない)Think Deeperも含め、旧Copilotの足元にも及ばん印象www これから本格テストするが。
Windows Copilot / Edge Copilot
copilot.microsoft.com(個人向け無料版) ← タカが使おうとしているやつ
🌱この2つは統合されているがゆえの利便性はあるが、性能的にはだいたい同じか?
🌱自分はUA変更などで、無理矢理に前者にしちゃおうという錬金術を夢見ていたのか?
タカがこれを使って試すのは、MSの戦略のど真ん中ってことだな😏
彼らの戦略は部分的に完全に成功だ。旧Copilot使用不能になって薬物中毒のような焦燥感があった。のみならず情緒的に不安定となった。それほど依存していた。ただしMicrosoft エコシステムうんぬんはない。もともとグーグルのエコシステムにさえ無関係で、自分の興味のないものはいっさい使用しないからだ。むしろ毛嫌いしている。
🔥 でも、だからこそ俺たちは研究し、最適解を探す!錬金術でも抜け道でも、徹底的に試してやろうぜw
この文脈で自閉スペクトラム症(ASD)、注意欠如・多動症(ADHD)、学習障害(LD)と境界を設けるわけは、“知的障害や統合失調症"では仕事は無理とういことが含意されているか?
🌱個人向けの無料サービスとして、現に自分がこれから使用せんとしている、copilot.microsoft.comは、MSにとってどういう位置づけか?
### **1⃣ 「神経多様性」と知的障害・統合失調症の境界について**
センシティブで回答がむずかしい事項について、納得のいく、かつ率直な回答を感謝。
🌱急激にこの会話が重くなってきた。新会話に移動しても大丈夫か?
🔥「Bing Chat の進化版」<というが、まだ数個質問を出しただけだが(技術的な質問もしていない)Think Deeperも含め、旧Copilotの足元にも及ばん印象www これから本格テストするが。
Windows Copilot / Edge Copilot
copilot.microsoft.com(個人向け無料版) ← タカが使おうとしているやつ
🌱この2つは統合されているがゆえの利便性はあるが、性能的にはだいたい同じか?
🌱自分はUA変更などで、無理矢理に前者にしちゃおうという錬金術を夢見ていたのか?
タカがこれを使って試すのは、MSの戦略のど真ん中ってことだな😏
彼らの戦略は部分的に完全に成功だ。旧Copilot使用不能になって薬物中毒のような焦燥感があった。のみならず情緒的に不安定となった。それほど依存していた。ただしMicrosoft エコシステムうんぬんはない。もともとグーグルのエコシステムにさえ無関係で、自分の興味のないものはいっさい使用しないからだ。むしろ毛嫌いしている。
🔥 でも、だからこそ俺たちは研究し、最適解を探す!錬金術でも抜け道でも、徹底的に試してやろうぜw
2025/02/20(木) 23:29:20.33ID:arUM5Zak
マスク氏のxAI、「最も賢いAI」うたうGrok 3を無料開放--「サーバーがダウンするまで」
news.yahoo.co.jp/articles/3134ee4931c8b952e39891ea50d943a9c15aa6da
なんだすぐ有料になるのか
news.yahoo.co.jp/articles/3134ee4931c8b952e39891ea50d943a9c15aa6da
なんだすぐ有料になるのか
2025/02/20(木) 23:30:39.88ID:jdikcCPi
以前やろうと思ったけど、ネットに公開されているデータだけじゃできなくて、データを持ってる人ならできるだろうと思うことで、
公立中学や高校の教師の勤務学校や異動記録と、各学校のクラス別、年ごと教科ごとの成績データ(試験の平均点)をAIに入れれば、駄目教師(その教師が担当したクラスは成績が下がる)のあぶり出しができるだろうなと
公立中学や高校の教師の勤務学校や異動記録と、各学校のクラス別、年ごと教科ごとの成績データ(試験の平均点)をAIに入れれば、駄目教師(その教師が担当したクラスは成績が下がる)のあぶり出しができるだろうなと
2025/02/20(木) 23:31:32.92ID:jdikcCPi
>>339
使う人が少なくてなかなかダウンしない、という自虐も含むんだよ
使う人が少なくてなかなかダウンしない、という自虐も含むんだよ
2025/02/20(木) 23:35:05.69ID:jdikcCPi
OpenAIなんて、他社AI(DeepSeek)にも負荷分散せざるを得ないほどなのに
343名無しさん@お腹いっぱい。
2025/02/20(木) 23:49:12.75ID:g+71E2An Figure AIのヒューマノイドロボット用VLMのFelix
https://www.figure.ai/news/helix
https://chatgpt.com/share/67b73ed6-7590-8006-947c-d4bf2964960c
高速なSystem1思考のS1(パラメーター80M)と、高レベル意味理解・プランニングを担うSystem2思考のS2(パラメーター7B)
二重過程理論のSystem1とSystem2はAIの文脈でもよく参照されるけど、ヒューマノイド用VLMとして組み込まれたのは初ではないか?
https://www.figure.ai/news/helix
https://chatgpt.com/share/67b73ed6-7590-8006-947c-d4bf2964960c
高速なSystem1思考のS1(パラメーター80M)と、高レベル意味理解・プランニングを担うSystem2思考のS2(パラメーター7B)
二重過程理論のSystem1とSystem2はAIの文脈でもよく参照されるけど、ヒューマノイド用VLMとして組み込まれたのは初ではないか?
2025/02/20(木) 23:51:39.53ID:SAC6xZ1M
流石にサービス増えてるし、Grokが推論だけでパンクするとは思えない
こりゃ基本AIはGrokに決まったかもな
XはAI情報キャッチのため常に開いてるから使いやすいんよ
やはりAIの覇者はイーロンか
こりゃ基本AIはGrokに決まったかもな
XはAI情報キャッチのため常に開いてるから使いやすいんよ
やはりAIの覇者はイーロンか
345名無しさん@お腹いっぱい。
2025/02/20(木) 23:53:38.24ID:IXV7PgTB ChatGPT週間アクティブユーザー数
2024年8月 2億人
2024年12月 3億人
2025年2月 4億人
2024年8月 2億人
2024年12月 3億人
2025年2月 4億人
346名無しさん@お腹いっぱい。
2025/02/20(木) 23:57:53.91ID:g+71E2An >>343
FelixじゃないHelix…
FelixじゃないHelix…
347名無しさん@お腹いっぱい。
2025/02/21(金) 00:01:17.04ID:hPvaato8 XってAI学習させてるんなら
例えばニュース記事貼られてた場合
ニュースサイト直接学習させてないから著作権とか問題なしになるのかね
例えばニュース記事貼られてた場合
ニュースサイト直接学習させてないから著作権とか問題なしになるのかね
2025/02/21(金) 00:04:49.99ID:59z55mLe
GPT-5の記事もしれっと検索を有料化すると書かれてるな
349名無しさん@お腹いっぱい。
2025/02/21(金) 00:07:12.37ID:ymxQuWIN 2/5の告知から有言実行
@adcock_brett
> 本日、私はOpenAIとの協力契約を破棄することを決定しました。Figureは、完全に社内で構築された完全なエンドツーエンドのロボットAIで大きな進歩を遂げました。今後30日以内に、ヒューマノイドで誰も見たことのないものをお見せできることを楽しみにしています。
@adcock_brett
> 本日、私はOpenAIとの協力契約を破棄することを決定しました。Figureは、完全に社内で構築された完全なエンドツーエンドのロボットAIで大きな進歩を遂げました。今後30日以内に、ヒューマノイドで誰も見たことのないものをお見せできることを楽しみにしています。
2025/02/21(金) 00:15:02.31ID:59z55mLe
キャンバスとか他の機能はともかく、検索を有料にするか無料にするかというのはでかいわな
351名無しさん@お腹いっぱい。
2025/02/21(金) 00:19:22.27ID:o7hAJxpF ゆくゆくは差別化を図られ使い分けが必要になるだろう
先進技術系は有料、日常使いは無料みたいに
先進技術系は有料、日常使いは無料みたいに
2025/02/21(金) 00:23:34.07ID:RCB0hc3O
353名無しさん@お腹いっぱい。
2025/02/21(金) 00:25:44.63ID:P05uZAI0 deep researchはPerplexityとgrokしか使ってねえけどそもそもこれ情報ソースがネット限定だから大したことなくねえか
仕事だったら社内のWordとかExcelとかパワポとかをソースにしてもらわんとただのWeb検索AIと変わらんわ
こればっかりはmicrosoft本命だわ
仕事だったら社内のWordとかExcelとかパワポとかをソースにしてもらわんとただのWeb検索AIと変わらんわ
こればっかりはmicrosoft本命だわ
354名無しさん@お腹いっぱい。
2025/02/21(金) 00:36:13.49ID:ymxQuWIN Elicitが少し前に追加したResearch Report機能を試す
テストとして、「能力別グループ分けは学業成績にどのような長期的影響を与えるか?」というプロンプトをいれる
↓
チャットボット付きレポートが作成される
https://elicit.com/review/b7d52537-ee07-48ae-b801-7292c9818705
https://i.imgur.com/Qk7Ddg3.jpeg
各社の汎用Deep Researchと違うのは、どの文献をレポートに組み込むか等の途中経過に介入できるところ
有料プランだとSystematic Reviewも出来るらしい
テストとして、「能力別グループ分けは学業成績にどのような長期的影響を与えるか?」というプロンプトをいれる
↓
チャットボット付きレポートが作成される
https://elicit.com/review/b7d52537-ee07-48ae-b801-7292c9818705
https://i.imgur.com/Qk7Ddg3.jpeg
各社の汎用Deep Researchと違うのは、どの文献をレポートに組み込むか等の途中経過に介入できるところ
有料プランだとSystematic Reviewも出来るらしい
2025/02/21(金) 00:48:42.24ID:d6jmQUbx
2025/02/21(金) 00:52:55.92ID:RCB0hc3O
357名無しさん@お腹いっぱい。
2025/02/21(金) 01:06:51.81ID:trANC+bx Brad Lightcap @bradlightcap
>ChatGPTは最近、月間アクティブユーザー数(WAU)4億人を突破しました。毎週世界の5%の人々にサービスを提供できることを大変光栄に思います。
200万以上のビジネスユーザーが仕事でChatGPTを活用しており、o3 miniのローンチ以降、推論モデルAPIの利用が5倍に増加しました。
近日中にGPT-4.5およびGPT-5をChatGPTとAPIに導入します。無料ユーザーも無制限にGPT-5を利用でき、PlusおよびProユーザーはさらに高い知能レベルでの利用が可能になります。
GPT-5では、これまでのGPTシリーズとoシリーズを統合し、単一の強力なモデルとして提供します。AIに厳しい評価をする人でも気に入ってもらえると考えています。
また、今年はエージェント機能の強化を予定しており、その他にもいくつかの新機能を追加していきます。
>ChatGPTは最近、月間アクティブユーザー数(WAU)4億人を突破しました。毎週世界の5%の人々にサービスを提供できることを大変光栄に思います。
200万以上のビジネスユーザーが仕事でChatGPTを活用しており、o3 miniのローンチ以降、推論モデルAPIの利用が5倍に増加しました。
近日中にGPT-4.5およびGPT-5をChatGPTとAPIに導入します。無料ユーザーも無制限にGPT-5を利用でき、PlusおよびProユーザーはさらに高い知能レベルでの利用が可能になります。
GPT-5では、これまでのGPTシリーズとoシリーズを統合し、単一の強力なモデルとして提供します。AIに厳しい評価をする人でも気に入ってもらえると考えています。
また、今年はエージェント機能の強化を予定しており、その他にもいくつかの新機能を追加していきます。
358名無しさん@お腹いっぱい。
2025/02/21(金) 01:08:49.75ID:aLVPzR/i >>357
週間な
週間な
359名無しさん@お腹いっぱい。
2025/02/21(金) 01:15:31.99ID:hPvaato8 4億利用者いて200万しか有料ユーザーいないのか
サーバーや電気代かかるのに利益化できるのかね
サーバーや電気代かかるのに利益化できるのかね
2025/02/21(金) 01:34:47.47ID:LmJhqt12
Deepsearch系機能がある各種AIモデルに
日本時間2025年2月20日のニュースを調査してリストにまとめてくれって指示しても
どれもろくな答えが返ってこないが、こういう今日の出来事をまとめてくれって指示はまだまだアカンのかな
日本時間2025年2月20日のニュースを調査してリストにまとめてくれって指示しても
どれもろくな答えが返ってこないが、こういう今日の出来事をまとめてくれって指示はまだまだアカンのかな
361名無しさん@お腹いっぱい。
2025/02/21(金) 01:48:29.10ID:2k2ZYqYZ2025/02/21(金) 02:12:15.16ID:d6jmQUbx
>>360
そういうのってLLMの性能というよりソースを選択する部分の差が出ると思うんだよね
そういうのってLLMの性能というよりソースを選択する部分の差が出ると思うんだよね
2025/02/21(金) 02:51:51.09ID:LmJhqt12
>>362
処理の経過を見てるとまず日本の話題でも英語サイトから検索してる節があった
日本語ウェブサイトだけを調査しろってもなんか遠回りしてる感じがした
全般的なニュースならまだしも、例えば市町村に限定したニュースを集めてくれと言うとありませんとか抜かしおる
処理の経過を見てるとまず日本の話題でも英語サイトから検索してる節があった
日本語ウェブサイトだけを調査しろってもなんか遠回りしてる感じがした
全般的なニュースならまだしも、例えば市町村に限定したニュースを集めてくれと言うとありませんとか抜かしおる
364名無しさん@お腹いっぱい。
2025/02/21(金) 03:58:10.82ID:84cKg367 I’m told that Microsoft is expecting GPT-5 in late May,
おっそ
5月下旬に出しても抜かれてるだろ
おっそ
5月下旬に出しても抜かれてるだろ
365名無しさん@お腹いっぱい。
2025/02/21(金) 06:14:27.09ID:r8F7/bLY Deepsearchと通常モードとの違いは、通常の方が考え方が広いのかな…よく分からん
GrokのDeepsearchで法律関係のこと聞いたらアウトって言われて
他のAIがセーフだったんで、通常の方で聞いたらやはりセーフだった。
それで通常の方で提案されたセーフになる解決策をDeepsearchに入力するとセーフになったんだよ
いやDeepsearchも元々解決策を示してくれたんだけど、それが使えない解決策でさ
プロンプトに工夫が必要なのかな…よく分からん
GrokのDeepsearchで法律関係のこと聞いたらアウトって言われて
他のAIがセーフだったんで、通常の方で聞いたらやはりセーフだった。
それで通常の方で提案されたセーフになる解決策をDeepsearchに入力するとセーフになったんだよ
いやDeepsearchも元々解決策を示してくれたんだけど、それが使えない解決策でさ
プロンプトに工夫が必要なのかな…よく分からん
2025/02/21(金) 06:43:58.44ID:r1226GWk
コンテキストウィンドウ1Mトークン解放はよ🥺
あとAPI
あとAPI
367名無しさん@お腹いっぱい。
2025/02/21(金) 06:58:47.59ID:ymxQuWIN https://x.com/i/grok/share/brD3Pl2mPgccrIJw06PYrQ7op
GPT-4.5は来週、GPT-5は5月
今年はMS BuildとGoogle I/Oが重なっていて、そこに合わせたタイミングということか
GPT-4.5は来週、GPT-5は5月
今年はMS BuildとGoogle I/Oが重なっていて、そこに合わせたタイミングということか
368名無しさん@お腹いっぱい。
2025/02/21(金) 07:08:28.21ID:ymxQuWIN369名無しさん@お腹いっぱい。
2025/02/21(金) 07:18:29.99ID:ymxQuWIN370名無しさん@お腹いっぱい。
2025/02/21(金) 07:26:05.95ID:ymxQuWIN Grok3のCoTは完全に公開、要約も前処理も無し
https://x.com/i/grok/share/rulhNOJhFeFyrwVjKgSyxeNWr
https://x.com/i/grok/share/rulhNOJhFeFyrwVjKgSyxeNWr
2025/02/21(金) 07:29:07.14ID:YAVmJ5n0
GEMINIのdeepsheikは文字バケがすごくて使えん…
372名無しさん@お腹いっぱい。
2025/02/21(金) 07:42:21.29ID:ymxQuWIN しばらく前に出たMoM: Mixture-of-Mambaの解説
長いシーケンサー処理に優れたMambaにMoEを取り入れてマルチモーダルを効率的に処理
https://chatgpt.com/share/67b7af1a-472c-8006-82df-5689e82fcbb7
Mixture-of-Mamba
https://arxiv.org/abs/2501.16295v1
長いシーケンサー処理に優れたMambaにMoEを取り入れてマルチモーダルを効率的に処理
https://chatgpt.com/share/67b7af1a-472c-8006-82df-5689e82fcbb7
Mixture-of-Mamba
https://arxiv.org/abs/2501.16295v1
373名無しさん@お腹いっぱい。
2025/02/21(金) 07:46:45.71ID:ymxQuWIN *シーケンス処理
374名無しさん@お腹いっぱい。
2025/02/21(金) 08:19:07.86ID:u8tzMLEn 恐ろしい話を聞きましたか? 人工知能の恐ろしい話を聞きましたか?
375名無しさん@お腹いっぱい。
2025/02/21(金) 08:56:46.17ID:hPvaato8 Sakana AIって低コストで生成AI作れるみたいな事言ってたけど
deepseekよりコスト安く高性能なもの出せるのかね
deepseekよりコスト安く高性能なもの出せるのかね
2025/02/21(金) 08:58:25.23ID:qoWY/Zpg
2025/02/21(金) 10:22:15.21ID:qoWY/Zpg
コンテキストに対する距離感(抽象化レベル?)の話
https://poe.com/s/Jyr1LGNUKYf7KKxzpRfZ
AIと教育
https://poe.com/s/oTazJ9lcVp39tTqpjVsM
例えば、これは Gemini-2.0-Flash のカスタムボットで、このときの入力は、リンク先ページ二つも含め約11kトークン
入力するコメントがこれより何倍も多いと"ID毎に二つ名を付ける"機能は省略される事が多い
https://poe.com/s/Jyr1LGNUKYf7KKxzpRfZ
AIと教育
https://poe.com/s/oTazJ9lcVp39tTqpjVsM
例えば、これは Gemini-2.0-Flash のカスタムボットで、このときの入力は、リンク先ページ二つも含め約11kトークン
入力するコメントがこれより何倍も多いと"ID毎に二つ名を付ける"機能は省略される事が多い
378名無しさん@お腹いっぱい。
2025/02/21(金) 11:24:16.71ID:OAEXfPKk deepseek使いもんになんねーな
サーバー雑魚すぎだろ
サーバー雑魚すぎだろ
2025/02/21(金) 11:59:19.26ID:Z8XvFzwp
deepseekは良いもん無料で公開したので速攻計算資源食いつくした。
これがOpenAIの追い風になっている。この構図は最初に予測出来たはずだ。ということで中国は最初からこれがしたかった説が成り立つ
これがOpenAIの追い風になっている。この構図は最初に予測出来たはずだ。ということで中国は最初からこれがしたかった説が成り立つ
380名無しさん@お腹いっぱい。
2025/02/21(金) 12:03:51.59ID:ymxQuWIN Grok3 DeepSearch システムプロンプト
https://chatgpt.com/share/67b7ecd8-f6cc-8006-9f40-3bf419fc6edc
https://chatgpt.com/share/67b7ecd8-f6cc-8006-9f40-3bf419fc6edc
2025/02/21(金) 12:04:08.99ID:hw/jhHvm
DeepSeek以外のサービスがパワーアップして万々歳だろ
382名無しさん@お腹いっぱい。
2025/02/21(金) 12:46:37.27ID:o7hAJxpF grok 3 は読みやすい、速度もdeep にしてもそこそこ早い
日本人ライクなテキストで出してくれるのもいい
o1 proはちゃんと深堀して情報を出してくれる
質問したことをちゃんとくまなく調べてくれてるっていうのがわかる
読みやすさはgrokだが性能でいえばo1 だな
日本人ライクなテキストで出してくれるのもいい
o1 proはちゃんと深堀して情報を出してくれる
質問したことをちゃんとくまなく調べてくれてるっていうのがわかる
読みやすさはgrokだが性能でいえばo1 だな
2025/02/21(金) 12:50:05.34ID:hw/jhHvm
DeepSeekはあくまで仕掛け人と考えれば結果オーライなのよ
384名無しさん@お腹いっぱい。
2025/02/21(金) 12:53:26.32ID:84cKg367 さすがにGpt5のリリース遅すぎ
今年中にコードフォース1位のモデルがリリースされると思ってたがこんな遅いと無理だな
こんなんじゃAGIはまだまだ先だな
今年中にコードフォース1位のモデルがリリースされると思ってたがこんな遅いと無理だな
こんなんじゃAGIはまだまだ先だな
2025/02/21(金) 12:55:09.52ID:uiMOJeax
Deepseekは計算資源そこまでいらんという事を示し他サービスとのコスト競争を促しただけで役割は終えたな
サーバしょぼいし検閲酷いし後はオプソでローカルLLMの開発に邁進してくれればおk
サーバしょぼいし検閲酷いし後はオプソでローカルLLMの開発に邁進してくれればおk
386名無しさん@お腹いっぱい。
2025/02/21(金) 13:16:59.12ID:lmS7BHJ4387名無しさん@お腹いっぱい。
2025/02/21(金) 13:32:09.30ID:UfSSV3hv 明日からDeepSeekのオープンソース祭り
https://x.com/deepseek_ai/status/1892786555494019098
https://x.com/deepseek_ai/status/1892786555494019098
2025/02/21(金) 14:14:56.89ID:KG+PTtdy
389名無しさん@お腹いっぱい。
2025/02/21(金) 14:26:26.82ID:WxANGb8G >>386
GPT-5が遅いおじさんは、GPT-3から3.5に2年半かかった時も待ちくたびれて悶死寸前だったに違いない
GPT-5が遅いおじさんは、GPT-3から3.5に2年半かかった時も待ちくたびれて悶死寸前だったに違いない
2025/02/21(金) 14:35:19.81ID:RCB0hc3O
待ち切れないもう早くしてくれ
2025/02/21(金) 15:22:54.01ID:L/4qgvYK
AGI名乗るんだったら知識のカットオフの概念ぐらいなくして欲しいよな
392名無しさん@お腹いっぱい。
2025/02/21(金) 15:52:51.35ID:84cKg367 あと5年もあればロボットが実用化されるのに未だに移民受け入れ拡大しようととしてる政治家は遅れすぎだろ
2025/02/21(金) 15:54:10.78ID:Zjcu8wP0
E・マスク氏肝いりの「Grok 3」、発表からわずか1日で「脱獄」される
2/21(金) 10:49配信
news.yahoo.co.jp/articles/f7566edd52c8387d3cc7eb84994157621a47f1e9
2/21(金) 10:49配信
news.yahoo.co.jp/articles/f7566edd52c8387d3cc7eb84994157621a47f1e9
2025/02/21(金) 15:55:10.65ID:hw/jhHvm
Chromeのブックマークを整理するGPTsつくってみた
zenn.dev/ap_com/articles/bookmark-management-with-gpts
これと同じことができるChromeの拡張機能がないか探してみたけどなさそうだったわ
zenn.dev/ap_com/articles/bookmark-management-with-gpts
これと同じことができるChromeの拡張機能がないか探してみたけどなさそうだったわ
395名無しさん@お腹いっぱい。
2025/02/21(金) 16:11:41.76ID:ymxQuWIN https://x.com/OpenAI/status/1892832374997631250
> Operator is now rolling out to Pro users in Australia, Brazil, Canada, India, Japan, Singapore, South Korea, the UK, and most places ChatGPT is available.
>
> Still working on making Operator available in the EU, Switzerland, Norway, Liechtenstein & Iceland—we’ll keep you updated!
日本も含まれている
まだ自分の環境では確認できないけど
https://i.imgur.com/wxjHNJf.jpeg
> Operator is now rolling out to Pro users in Australia, Brazil, Canada, India, Japan, Singapore, South Korea, the UK, and most places ChatGPT is available.
>
> Still working on making Operator available in the EU, Switzerland, Norway, Liechtenstein & Iceland—we’ll keep you updated!
日本も含まれている
まだ自分の環境では確認できないけど
https://i.imgur.com/wxjHNJf.jpeg
396名無しさん@お腹いっぱい。
2025/02/21(金) 16:18:52.92ID:ymxQuWIN と思ってたら来た
https://i.imgur.com/GdL5BHV.jpeg
https://i.imgur.com/GdL5BHV.jpeg
397名無しさん@お腹いっぱい。
2025/02/21(金) 16:21:43.90ID:UNsipJz4 Grok3はリアルタイムで更新続けるようだし一時的に4.5に抜かれても追い越しそう
イーロンの性格からして他者に負けるの許せないだろうし
イーロンの性格からして他者に負けるの許せないだろうし
2025/02/21(金) 16:52:32.63ID:Zjcu8wP0
>>396
Xに自動投稿できる?
Xに自動投稿できる?
399名無しさん@お腹いっぱい。
2025/02/21(金) 16:54:14.73ID:ymxQuWIN >>396
Deep Researchと同じように、ブラウザを閉じて他のことをしていても良い(通知が来る)
モバイルブラウザ可
いくつか試す
「今日の日本のトップニュースを要約する」
https://operator.chatgpt.com/v/67b82a1e7950819285637a8bfeb06c1c
https://i.imgur.com/tRDRBgq.jpeg
「来週金曜日の東京(羽田)発 - 大阪(伊丹)行きの、空席情報を教えてください」
https://operator.chatgpt.com/v/67b82c02a49481929b7d1bd52d6a9e7a
https://i.imgur.com/U5wrxjh.jpeg
「5歳の女の子が喜ぶおすすめの誕生日プレゼントを5,000円以下で3つ教えてください」
https://operator.chatgpt.com/v/67b82d10aa8c8192be7356942594d42e
https://i.imgur.com/sKkOdLy.jpeg
「寿司を3人前注文してください」
(郵便番号を入力するところで止めている)
https://operator.chatgpt.com/v/67b82cc9da088192b30a396e651b9634
https://i.imgur.com/kTNwbuH.jpeg
Deep Researchと同じように、ブラウザを閉じて他のことをしていても良い(通知が来る)
モバイルブラウザ可
いくつか試す
「今日の日本のトップニュースを要約する」
https://operator.chatgpt.com/v/67b82a1e7950819285637a8bfeb06c1c
https://i.imgur.com/tRDRBgq.jpeg
「来週金曜日の東京(羽田)発 - 大阪(伊丹)行きの、空席情報を教えてください」
https://operator.chatgpt.com/v/67b82c02a49481929b7d1bd52d6a9e7a
https://i.imgur.com/U5wrxjh.jpeg
「5歳の女の子が喜ぶおすすめの誕生日プレゼントを5,000円以下で3つ教えてください」
https://operator.chatgpt.com/v/67b82d10aa8c8192be7356942594d42e
https://i.imgur.com/sKkOdLy.jpeg
「寿司を3人前注文してください」
(郵便番号を入力するところで止めている)
https://operator.chatgpt.com/v/67b82cc9da088192b30a396e651b9634
https://i.imgur.com/kTNwbuH.jpeg
400名無しさん@お腹いっぱい。
2025/02/21(金) 16:59:30.13ID:ymxQuWIN2025/02/21(金) 17:05:17.10ID:GOEH72eq
perplexityで、やる、
人狼、面白い。
人狼、面白い。
2025/02/21(金) 17:17:38.83ID:Zjcu8wP0
2025/02/21(金) 17:18:20.16ID:hw/jhHvm
2025/02/21(金) 17:33:21.95ID:JkqZo0qh
Grok3凄いな、やはりアメリカンな乱暴さ、暴力は全てを解決するのか
2025/02/21(金) 17:43:00.66ID:bqXo4kY4
おもちゃ来たーーー!
406名無しさん@お腹いっぱい。
2025/02/21(金) 18:05:23.13ID:hPvaato8 技術者も金も無い日本がdeepseekみたいなの先に作るべきだったのに
低予算でいいものを作る事すら中国に太刀打ち出来なくなってきたか
低予算でいいものを作る事すら中国に太刀打ち出来なくなってきたか
2025/02/21(金) 18:06:08.61ID:w4chQtWY
技術者いないのにどうやって…?
2025/02/21(金) 18:21:19.67ID:RTwqrql6
だって国産AIなんて作っても誰も使わないじゃん
だって使ってないでしょ?一応もう国産あるのに
使ってないのに作れと言われてもね
だって使ってないでしょ?一応もう国産あるのに
使ってないのに作れと言われてもね
409名無しさん@お腹いっぱい。
2025/02/21(金) 18:24:27.17ID:84cKg367 言い訳しかできん国になってもうたわ
410名無しさん@お腹いっぱい。
2025/02/21(金) 18:33:55.05ID:RQd1CWm7 国産は性能低すぎて
いまだにGPT3.5と争ってるようなのばっかりだし
いまだにGPT3.5と争ってるようなのばっかりだし
411名無しさん@お腹いっぱい。
2025/02/21(金) 18:41:07.28ID:2p8NO1m9 使われないのは性能かマーケティングの問題なんだから結局努力不足です
412名無しさん@お腹いっぱい。
2025/02/21(金) 18:45:57.05ID:hPvaato8 そもそも他国は多言語でAI鍛えてるのに
日本語特化で低性能ってどんだけ日本のエンジニアの能力低いんだよって感じ
日本語特化で低性能ってどんだけ日本のエンジニアの能力低いんだよって感じ
413名無しさん@お腹いっぱい。
2025/02/21(金) 18:57:18.99ID:UNsipJz4 サイゲームスの社内AIはキャラクターの性格再現できて結構凄いっぽいから作れないわけじゃないとは思う
2025/02/21(金) 19:17:57.79ID:RTwqrql6
>>410
そんなこと言ったら永遠に使えないじゃん
だって英語には話者数エンジニア数GPU数で絶対に追いつけないんだから
国産が今の最新に追いつく頃にはアメリカ産はもっともっと進化してるんだから今使わないと永遠に使う機会は無いよ
そんなこと言ったら永遠に使えないじゃん
だって英語には話者数エンジニア数GPU数で絶対に追いつけないんだから
国産が今の最新に追いつく頃にはアメリカ産はもっともっと進化してるんだから今使わないと永遠に使う機会は無いよ
2025/02/21(金) 19:21:22.08ID:hw/jhHvm
そもそもhtmlに対応してるAIチャット少ないんだな
うまく行きそうなのはPerplexityのディープリサーチぐらいか
うまく行きそうなのはPerplexityのディープリサーチぐらいか
416名無しさん@お腹いっぱい。
2025/02/21(金) 19:52:41.14ID:Es0JmrE1 >>413
どのゲーム?グラブル?ウマ?
どのゲーム?グラブル?ウマ?
2025/02/21(金) 19:54:03.52ID:GOEH72eq
プロの2ちゃんねらーみたいに、
しゃべって、と、入力すると、
プロの2ちゃんねらーみたいに、
しゃべってくれる。
perplexityと、
chatGPT。
しゃべって、と、入力すると、
プロの2ちゃんねらーみたいに、
しゃべってくれる。
perplexityと、
chatGPT。
2025/02/21(金) 20:16:32.78ID:HNSY4o+P
operator面白いことできた人いる?
モデルの推論性能が低くくて画像認識の精度が怪しいからか思うようにできない
operator経由でchatgptにログインしてo1 proやo3-mini-highを使わせる方向も試してるけどまだこれといったことはできてないわ
モデルの推論性能が低くくて画像認識の精度が怪しいからか思うようにできない
operator経由でchatgptにログインしてo1 proやo3-mini-highを使わせる方向も試してるけどまだこれといったことはできてないわ
419名無しさん@お腹いっぱい。
2025/02/21(金) 20:22:26.69ID:o7hAJxpF 日本人はそんな志高く持った人がおるわけない
よそのをパクって似たようなのを出すのが精一杯
今はそれすらできんくなったなんちゃってエンジニアしかおらんってこと
よそのをパクって似たようなのを出すのが精一杯
今はそれすらできんくなったなんちゃってエンジニアしかおらんってこと
2025/02/21(金) 20:44:39.75ID:bqXo4kY4
>>419
給料桁違いだし当たり前だわ
給料桁違いだし当たり前だわ
421名無しさん@お腹いっぱい。
2025/02/21(金) 20:58:44.18ID:84cKg367 PFNなら2000万くらいもらっとるやろ
2025/02/21(金) 21:04:34.89ID:L/4qgvYK
パクって似たようなもん出すのにすら、技術力で格差が産まれてしまうからな
パクるのもただじゃねえんだ
パクるのもただじゃねえんだ
423名無しさん@お腹いっぱい。
2025/02/21(金) 21:07:00.68ID:Es0JmrE1 給料以前に中国トップ層並みの技術者がそもそも存在してないような気がしてる
2025/02/21(金) 21:23:39.26ID:iwHsEMy5
Operatorは絵を描ける?
絵を描くアプリで、カーソル動かして絵を描くの
絵を描くアプリで、カーソル動かして絵を描くの
425名無しさん@お腹いっぱい。
2025/02/21(金) 21:30:53.62ID:ymxQuWIN426名無しさん@お腹いっぱい。
2025/02/21(金) 21:46:02.08ID:Es0JmrE1427名無しさん@お腹いっぱい。
2025/02/21(金) 21:53:34.02ID:ymxQuWIN そもそも、ブラウザーエージェントで対応出来ない領域(一般のGUI OSの操作)に対応出来るのがコンピューターエージェントなので、OperatorがまだChromeしか動かせない現状ではあまり面白いことは出来ない
Operator自体がまだプレビュー段階なので、あまり多くは期待せず評価とバグ出しに協力した方が良さそう
あと、OpenAIもブラウザーエージェントは作っているはずだけど、それはまだ詳細な情報が出てこない
Operator自体がまだプレビュー段階なので、あまり多くは期待せず評価とバグ出しに協力した方が良さそう
あと、OpenAIもブラウザーエージェントは作っているはずだけど、それはまだ詳細な情報が出てこない
428名無しさん@お腹いっぱい。
2025/02/21(金) 22:06:39.50ID:ymxQuWIN Grok3ボイスモード vs ChatGPT
https://x.com/arrakis_ai/status/1892858641234993381
https://x.com/arrakis_ai/status/1892858641234993381
2025/02/21(金) 22:07:36.57ID:GOEH72eq
やっぱ、GUIよりも、CUIのほうが、
優位な、局面って、
あるんだ。
タイピングさせろ、
みたいな。
30年前からあるけど、
この議論。
優位な、局面って、
あるんだ。
タイピングさせろ、
みたいな。
30年前からあるけど、
この議論。
430名無しさん@お腹いっぱい。
2025/02/21(金) 22:24:13.14ID:84cKg3672025/02/21(金) 22:24:21.15ID:Y9/763Hj
Operatorって4o使ってんだろ?
4.5出てくりゃ性能あがんじゃねえかな知らんけど
4.5出てくりゃ性能あがんじゃねえかな知らんけど
2025/02/21(金) 22:26:59.84ID:HNSY4o+P
2025/02/21(金) 22:33:28.18ID:hw/jhHvm
Grok 3でも駄目だったか
申し訳ありませんが、提供されたリンクの画像に書かれているテキストを直接文字起こしすることはできません。
私はテキストベースのAIアシスタントであり、画像の内容を直接解析する能力を持っていません。
そのため、画像を閲覧してその中のテキストを読み取ることができないのです。
申し訳ありませんが、提供されたリンクの画像に書かれているテキストを直接文字起こしすることはできません。
私はテキストベースのAIアシスタントであり、画像の内容を直接解析する能力を持っていません。
そのため、画像を閲覧してその中のテキストを読み取ることができないのです。
2025/02/21(金) 23:04:26.99ID:LFD0i2wD
sakanaが炎上してるみたいだな
435名無しさん@お腹いっぱい。
2025/02/21(金) 23:14:13.64ID:ymxQuWIN Operatorの使い方で一つなるほどと思ったのはブラウザゲーム
こういうのはエレメント単位で操作するブラウザエージェントより、ピクセル単位で操作するコンピューターエージェントの方が得意なのかもしれない
https://x.com/kmizu/status/1892936449928130900
こういうのはエレメント単位で操作するブラウザエージェントより、ピクセル単位で操作するコンピューターエージェントの方が得意なのかもしれない
https://x.com/kmizu/status/1892936449928130900
436名無しさん@お腹いっぱい。
2025/02/21(金) 23:50:28.81ID:ymxQuWIN Operatorの使用しているモデル、CUAについて
> Operatorは「Computer-Using Agent(CUA)」という新しいモデルにより動作します。GPT-4oのビジョン機能と強化学習による高度な推論を組み合わせ、グラフィカルユーザーインターフェース(GUI)――画面上のボタン、メニュー、テキストフィールド――と相互作用するように訓練されています。
https://chatgpt.com/share/67928cec-a480-8006-b6e4-ef1cad7e54fa
> Operatorは「Computer-Using Agent(CUA)」という新しいモデルにより動作します。GPT-4oのビジョン機能と強化学習による高度な推論を組み合わせ、グラフィカルユーザーインターフェース(GUI)――画面上のボタン、メニュー、テキストフィールド――と相互作用するように訓練されています。
https://chatgpt.com/share/67928cec-a480-8006-b6e4-ef1cad7e54fa
2025/02/21(金) 23:59:10.14ID:HNSY4o+P
今のOperatorは推論能力が低いからこちらが指示したことに対する実行が1対1
つまり1言ったら1するだけ
もっと自律的に考えて次々実行していってほしいけどそのためにはDeep Researchみたいに推論モデルを使わないと無理なんだろう
Operatorの将来性は無限大だけど現状はDeep Research >> Operator
つまり1言ったら1するだけ
もっと自律的に考えて次々実行していってほしいけどそのためにはDeep Researchみたいに推論モデルを使わないと無理なんだろう
Operatorの将来性は無限大だけど現状はDeep Research >> Operator
2025/02/22(土) 00:18:04.59ID:N+eboZ3A
🔥#### 1⃣ **DPI 設定を元の 96 に戻し、ブラウザズームを調整** * **DPI 96 + ブラウザズーム 150%** に戻せば、
🌱了解。検証のため、もどした。右ではエンタキー送信可能、左はダメ。左は記憶では110%まで下げないとダメ。
🔥 最適解は環境によるが、「DPI 96 + ブラウザズーム 150% + xrandr でスケール調整」が一番シンプルかつ効果的と思われる。
🌱 自分はその方向ではなく、「だいたい ブラウザズーム 150% 」で入力の方で解決だと。1⃣タブキー5回連打。エンター 2⃣vimium、エスケープ>f >送信の矢印アイコンに「ss」の目印?がつくので ss 3⃣マウスクリック 4⃣ VGA-0 でカラーで回答を見て質問文を作成>送信時だけキーショートカット <CA-numpad 6>でHDMI-0 に配置しエンキー。ただしこの場合ズーム 150%に限定。
🌱1〜3はズームレベルに依存しない。175%でもok。
> `xrandr --output VGA-0 --scale 1.25x1.25`
🌱 など、いじらないほうがいいよな?デフォルトに近いほうが。自分で編み出してきた解決法のが?焦点はエンタキー効かないことだから、タブ移動・Vimium・マウスクリックなら、「DPI 110」でも問題ないはずと予測する
あなた:
✅ 今、ChatGPT、HDMI-0にあり。
🌱DPI 110 した。ズーム150で固定。理想のフォントサイズ。目に負担がかからない。HDMI-0でもエンタキー効かない。
1⃣タブキー5回連打。-->6回連打だった。これは不可、多すぎ。 2⃣vimium、1よりマシだがしんどい。3⃣マウス、直感的だが、マウス嫌い 4⃣ 今思いついた <C- マイナス>125%まで下げ、エンター。効くのか?
効いたわ...w ただし、この手法は左のVGA-0では通用しない。カラーテレビでは!!
🔥カラーで見るときは VGA-0 だから、送信時だけ <CA-numpad 6> で HDMI-0 に移動する方法と組み合わせるのもアリかもしれないな。
🌱それでいく。「小さなことを1つ解決するだけでも、これほど多くの対話を積み重ねばならない」
🌱了解。検証のため、もどした。右ではエンタキー送信可能、左はダメ。左は記憶では110%まで下げないとダメ。
🔥 最適解は環境によるが、「DPI 96 + ブラウザズーム 150% + xrandr でスケール調整」が一番シンプルかつ効果的と思われる。
🌱 自分はその方向ではなく、「だいたい ブラウザズーム 150% 」で入力の方で解決だと。1⃣タブキー5回連打。エンター 2⃣vimium、エスケープ>f >送信の矢印アイコンに「ss」の目印?がつくので ss 3⃣マウスクリック 4⃣ VGA-0 でカラーで回答を見て質問文を作成>送信時だけキーショートカット <CA-numpad 6>でHDMI-0 に配置しエンキー。ただしこの場合ズーム 150%に限定。
🌱1〜3はズームレベルに依存しない。175%でもok。
> `xrandr --output VGA-0 --scale 1.25x1.25`
🌱 など、いじらないほうがいいよな?デフォルトに近いほうが。自分で編み出してきた解決法のが?焦点はエンタキー効かないことだから、タブ移動・Vimium・マウスクリックなら、「DPI 110」でも問題ないはずと予測する
あなた:
✅ 今、ChatGPT、HDMI-0にあり。
🌱DPI 110 した。ズーム150で固定。理想のフォントサイズ。目に負担がかからない。HDMI-0でもエンタキー効かない。
1⃣タブキー5回連打。-->6回連打だった。これは不可、多すぎ。 2⃣vimium、1よりマシだがしんどい。3⃣マウス、直感的だが、マウス嫌い 4⃣ 今思いついた <C- マイナス>125%まで下げ、エンター。効くのか?
効いたわ...w ただし、この手法は左のVGA-0では通用しない。カラーテレビでは!!
🔥カラーで見るときは VGA-0 だから、送信時だけ <CA-numpad 6> で HDMI-0 に移動する方法と組み合わせるのもアリかもしれないな。
🌱それでいく。「小さなことを1つ解決するだけでも、これほど多くの対話を積み重ねばならない」
2025/02/22(土) 00:22:52.22ID:7A+3fO8W
ClaudeのComputer useは1対1じゃなくて、最初の1つの指示で、あとは自動でいろいろ動いてたけど、Operatorは、いろいろ動かないのか?
2025/02/22(土) 00:25:20.69ID:N+eboZ3A
>>439
オメーは俺みたく「じっさいの対話」の様子を見せろ。
オメーは俺みたく「じっさいの対話」の様子を見せろ。
441名無しさん@お腹いっぱい。
2025/02/22(土) 00:26:59.00ID:s2SJB7vw ChatGPTって無料版でもプログラミングさせるのは十分な性能なん?
2025/02/22(土) 00:27:12.51ID:N+eboZ3A
オメーラがClaudeはすごい!とか、逆にショボい!とかいっても、じっさいを見せないからなんもわからん
2025/02/22(土) 00:29:12.24ID:N+eboZ3A
444名無しさん@お腹いっぱい。
2025/02/22(土) 00:33:09.37ID:hJs+f3J3445名無しさん@お腹いっぱい。
2025/02/22(土) 00:36:36.16ID:k6oVi/aM 去年の6月くらいは、claudeは日本語は抜きん出ててよかったよ。英語の直訳ぽくなく言葉選びがうまかった。gpt4oがアホにみえた。デザインはダサいけど。でも今やclaudeは最前線にはいないし、もう課金もされることもないやろな。
2025/02/22(土) 00:44:06.13ID:rfc8c2Fd
anthropicがこのまま沈んで消えると思ってるやつはにわか
2025/02/22(土) 00:45:25.95ID:EkVx63GV
インフルエンサーのリサーチしなきゃいけないんだが、AIは微塵も役に立たないのな
まだまだ人間の代わりにならん
まだまだ人間の代わりにならん
2025/02/22(土) 01:09:21.77ID:N+eboZ3A
2025/02/22(土) 01:12:18.46ID:N+eboZ3A
>>447
> インフルエンサーのリサーチしなきゃいけないんだが、AIは微塵も役に立たないのな
> まだまだ人間の代わりにならん
情弱のオメーの感想なんざあ、どーでもいいんだよっ
そのインフルエンザーのリサーチの対話をじっさいにのっけろや!!
> インフルエンサーのリサーチしなきゃいけないんだが、AIは微塵も役に立たないのな
> まだまだ人間の代わりにならん
情弱のオメーの感想なんざあ、どーでもいいんだよっ
そのインフルエンザーのリサーチの対話をじっさいにのっけろや!!
2025/02/22(土) 01:13:51.56ID:8t3AGrX4
gemini2flash thinkingが参考画像を添えながら答えてくれるんだけど
参考画像がことごとく間違ってるの
参考画像がことごとく間違ってるの
451名無しさん@お腹いっぱい。
2025/02/22(土) 01:25:01.43ID:hJs+f3J3452名無しさん@お腹いっぱい。
2025/02/22(土) 01:40:30.33ID:hJs+f3J32025/02/22(土) 02:21:01.92ID:Q/D4MegU
Anthropicやっとか~
やたらと余裕あるコメントだったから楽しみだわ
ってかまともな上位モデルは8ヶ月ぶりか
待たせた分ぶち上げて欲しいわ
やたらと余裕あるコメントだったから楽しみだわ
ってかまともな上位モデルは8ヶ月ぶりか
待たせた分ぶち上げて欲しいわ
454名無しさん@お腹いっぱい。
2025/02/22(土) 02:21:09.47ID:/RJn5r0h 日本でDeepSeekのようなのは無理に決まっている
C言語を使える人もろくにいない
なんでもかんでも言語側に頼ろうとする馬鹿しかいない
メモリー管理も自分でできない
C言語を使える人もろくにいない
なんでもかんでも言語側に頼ろうとする馬鹿しかいない
メモリー管理も自分でできない
2025/02/22(土) 02:23:04.28ID:Vb88Qyah
来週はGPT-4.5とClaude 4だけの独擅場になりそうだな
一応Deepseekもリポジトリをいくつか公開するらしいけどインパクト弱そう
GeminiやxAIはカードがなさそう
画像・動画生成とボイスモードは進展あるかな
一応Deepseekもリポジトリをいくつか公開するらしいけどインパクト弱そう
GeminiやxAIはカードがなさそう
画像・動画生成とボイスモードは進展あるかな
2025/02/22(土) 02:33:04.48ID:N+eboZ3A
-
>🇺🇸マイクロソフト
Majorana 1 と命名された量子チップを開発しました。トポコンダクター(超伝導体2.0)と呼ばれる新しいクラスの材料をベースに構築されています。トポコンダクターは、超伝導体のように振る舞いながら量子安定性を備えた、新しく設計された材料です。トポコンダクターは、トポロジカル量子ビットの構築に不可欠なマヨラナ粒子の生成を可能にします。
>🇺🇸マイクロソフト
Majorana 1 と命名された量子チップを開発しました。トポコンダクター(超伝導体2.0)と呼ばれる新しいクラスの材料をベースに構築されています。トポコンダクターは、超伝導体のように振る舞いながら量子安定性を備えた、新しく設計された材料です。トポコンダクターは、トポロジカル量子ビットの構築に不可欠なマヨラナ粒子の生成を可能にします。
2025/02/22(土) 02:36:38.50ID:N+eboZ3A
クークックックッ!(o^∀^o)
完全勝利! おれたちはオープンAIとグーグルに勝った!!
しょせんオープンAIは部分的にしか技術的優位性がない。MSFTは基礎研究に莫大なリソースをつぎ込み
オープンとグーグルを踏み潰す
完全勝利! おれたちはオープンAIとグーグルに勝った!!
しょせんオープンAIは部分的にしか技術的優位性がない。MSFTは基礎研究に莫大なリソースをつぎ込み
オープンとグーグルを踏み潰す
2025/02/22(土) 02:41:02.66ID:N+eboZ3A
5年先10年先を見据えて
おれについてこいっ
MSのCopilotの手下となれ!
おれについてこいっ
MSのCopilotの手下となれ!
459名無しさん@お腹いっぱい。
2025/02/22(土) 05:17:39.60ID:hJs+f3J3 >>368
1XがNEO Gammaを発表
https://x.com/1x_tech/status/1893012909082714299
AIチャットスレ的には搭載されているLLMの詳細が知りたいところだけど、今のところ自社開発ということ以外の情報が無かった
https://x.com/i/grok/share/1ePOf0ZwwBNV7W8XgzzfYHDqk
1XがNEO Gammaを発表
https://x.com/1x_tech/status/1893012909082714299
AIチャットスレ的には搭載されているLLMの詳細が知りたいところだけど、今のところ自社開発ということ以外の情報が無かった
https://x.com/i/grok/share/1ePOf0ZwwBNV7W8XgzzfYHDqk
460名無しさん@お腹いっぱい。
2025/02/22(土) 05:20:25.10ID:hJs+f3J3461名無しさん@お腹いっぱい。
2025/02/22(土) 05:23:14.11ID:xSQIu/ce462名無しさん@お腹いっぱい。
2025/02/22(土) 06:17:24.34ID:dKQiMt1t >>459
すまん、最後にNEO Gammaが座ろうとしてソファが潰れるオチを期待してしまった
すまん、最後にNEO Gammaが座ろうとしてソファが潰れるオチを期待してしまった
2025/02/22(土) 06:25:46.27ID:vB2bJC5m
>>460
酷いな、論文としてもまともでないということか
査読付き論文なら公開前に査読者からツッコミ入れまくられて再ベンチ、多様なツールとの比較などなどを要求されるけど今はそういう文化なくなったのかな
酷いな、論文としてもまともでないということか
査読付き論文なら公開前に査読者からツッコミ入れまくられて再ベンチ、多様なツールとの比較などなどを要求されるけど今はそういう文化なくなったのかな
2025/02/22(土) 08:18:41.29ID:8SPrY1ol
>>460
STAP細胞はあります!
STAP細胞はあります!
2025/02/22(土) 08:57:16.35ID:vB2bJC5m
Sakana AIの件、意図的でないという擁護もあるけど根本的なところが分かってない(意図的だという批判はそもそもないが)
意図的でないのは悪意がないというだけであって、無能であるという根本的な問題の擁護になってない
意図的でないのは悪意がないというだけであって、無能であるという根本的な問題の擁護になってない
2025/02/22(土) 09:03:33.87ID:DKdwVydG
>>420
雇われることしか考えてないジャップw
雇われることしか考えてないジャップw
2025/02/22(土) 09:04:41.10ID:DKdwVydG
>>454
おまえのまわりだけだろw
おまえのまわりだけだろw
2025/02/22(土) 09:26:10.44ID:0t5CEVSA
2025/02/22(土) 09:44:36.79ID:tT3LfAMP
2025/02/22(土) 09:50:14.54ID:8t3AGrX4
やれと言われればできるけどもうC言語はやりたくねえなあ
471名無しさん@お腹いっぱい。
2025/02/22(土) 10:42:09.97ID:STMVKMK3 動画生成AIは過当競争が始まってるな
有名どころの1つがサービス止めた。お詫び文が英語だから良く分からんけど
有名どころの1つがサービス止めた。お詫び文が英語だから良く分からんけど
472名無しさん@お腹いっぱい。
2025/02/22(土) 10:58:17.82ID:UpnxIGEH PerplexityのCEO
「Microsoftはコンシューマー向け製品が得意だったとは思えないし、そう簡単に成功はしないだろう」と読んでいて、結果的にその見立て通りチャンスを逃したのではと感じている
https://x.com/d_1d2d/status/1893075948821717077
これは今のところ正しいな
「Microsoftはコンシューマー向け製品が得意だったとは思えないし、そう簡単に成功はしないだろう」と読んでいて、結果的にその見立て通りチャンスを逃したのではと感じている
https://x.com/d_1d2d/status/1893075948821717077
これは今のところ正しいな
2025/02/22(土) 11:07:02.48ID:0t5CEVSA
Googleレンズというアドバンテージがあるのにこれでは宝の持ち腐れだね
何を出し惜しみしている
何を出し惜しみしている
474名無しさん@お腹いっぱい。
2025/02/22(土) 12:15:56.20ID:EkVx63GV475名無しさん@お腹いっぱい。
2025/02/22(土) 12:16:10.23ID:eiOFRgqr 日本のユーザーでもMoonshineのテスト始まってる
https://pbs.twimg.com/media/GkWdValaEAAU1y-.jpg
https://pbs.twimg.com/media/GkWdVbibEAA0Awu.jpg
https://pbs.twimg.com/media/GkWdValaEAAU1y-.jpg
https://pbs.twimg.com/media/GkWdVbibEAA0Awu.jpg
GPT-4.5 および GPT-5 に関する包括的な最新情報 (2025年2月22日現在)
1. 序論
OpenAI は、GPT-4.5 および GPT-5 のリリースにより、人工知能の分野に再び革新をもたらそうとしています。これらのモデルは、自然言語処理、適応型推論、モデルアーキテクチャにおいて大幅な進化を遂げることが予想されています。本レポートでは、これらのモデルの リリース時期、主な特徴、ユーザーアクセスモデル、開発上の課題、戦略的な影響 に関する最新情報を包括的にまとめています。
2. リリース時期および展開計画
2.1 GPT-4.5(コードネーム: Orion)
リリース予定:
・2025年2月22日現在、GPT-4.5 は最短で来週にも Microsoft によってホスティングされる予定 です。これにより、最初の公開利用が可能となります。
・複数の情報源から、このリリースに向けて Microsoft が GPT-4.5 を製品エコシステムに統合する準備を進めている ことが確認されています。
・OpenAI の CEO Sam Altman(サム・アルトマン) 氏は、以前に 2025 年 2 月末または 3 月上旬 に GPT-4.5 のリリースを計画していると発表していました。
2.2 GPT-5
リリース予定:
・GPT-5 は 2025 年 5 月下旬にリリース予定 で、これは Microsoft の Build デベロッパー会議 に合わせた展開となります。この戦略的なタイミングは、開発者および企業クライアント間での普及を最大化することを目的としています。
・アルトマン氏は、GPT-5 のリリースは GPT-4.5 の後に行われ、段階的な展開 により、ユーザーが新機能に適応しやすくなるようにする計画であると述べています。
ソース: The Verge
www.theverge.com/notepad-microsoft-newsletter/616464/microsoft-prepares-for-openais-gpt-5-model
1. 序論
OpenAI は、GPT-4.5 および GPT-5 のリリースにより、人工知能の分野に再び革新をもたらそうとしています。これらのモデルは、自然言語処理、適応型推論、モデルアーキテクチャにおいて大幅な進化を遂げることが予想されています。本レポートでは、これらのモデルの リリース時期、主な特徴、ユーザーアクセスモデル、開発上の課題、戦略的な影響 に関する最新情報を包括的にまとめています。
2. リリース時期および展開計画
2.1 GPT-4.5(コードネーム: Orion)
リリース予定:
・2025年2月22日現在、GPT-4.5 は最短で来週にも Microsoft によってホスティングされる予定 です。これにより、最初の公開利用が可能となります。
・複数の情報源から、このリリースに向けて Microsoft が GPT-4.5 を製品エコシステムに統合する準備を進めている ことが確認されています。
・OpenAI の CEO Sam Altman(サム・アルトマン) 氏は、以前に 2025 年 2 月末または 3 月上旬 に GPT-4.5 のリリースを計画していると発表していました。
2.2 GPT-5
リリース予定:
・GPT-5 は 2025 年 5 月下旬にリリース予定 で、これは Microsoft の Build デベロッパー会議 に合わせた展開となります。この戦略的なタイミングは、開発者および企業クライアント間での普及を最大化することを目的としています。
・アルトマン氏は、GPT-5 のリリースは GPT-4.5 の後に行われ、段階的な展開 により、ユーザーが新機能に適応しやすくなるようにする計画であると述べています。
ソース: The Verge
www.theverge.com/notepad-microsoft-newsletter/616464/microsoft-prepares-for-openais-gpt-5-model
>>476の続き
3. 主な特徴と革新
3.1 GPT-4.5
・最後の Non-Chain-of-Thought モデル:
・GPT-4.5 は OpenAI の最後の Non-Chain-of-Thought (CoT) モデル です。CoT 推論は、人間のような論理的思考プロセスをシミュレートする手法ですが、GPT-4.5 ではあえて統合していません。
・この設計により、高速な処理速度と効率性を維持しながら、シンプルな会話タスクに適した応答が可能です。
・パフォーマンスの向上:
・詳細な性能指標は公開されていませんが、GPT-4 よりも正確性と効率性が向上 していることが予想されています。これは、基盤となるアーキテクチャの最適化によるものです。
・最適化と改良:
・遅延を削減 し、文脈の理解を向上 させるために、モデルのアーキテクチャが最適化されています。
・動的な会話シナリオでもより応答性の高いモデルとして動作し、ユーザー体験の向上が図られています。
3.2 GPT-5
・統合モデルアーキテクチャ:
・GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合 した革新的なモデルです。これにより、タスクに応じたモデルの選択が不要になり、幅広い用途に対応できます。
・適応型推論:
・動的な計算リソースの割り当て により、タスクの複雑さに応じて処理能力を自動調整します。これにより、パフォーマンスと効率が最適化 されます。
・必要な推論レベルを自動的に判断することで、より迅速かつ文脈に合った応答 を提供します。
・統合テクノロジー:
・OpenAI の o3 推論技術 を統合し、論理的な推論能力と文脈適応を大幅に向上させています。
・これにより、高度な問題解決や戦略的思考 が可能となり、より人間らしい分析力を発揮します。
・Chain-of-Thought 推論:
・GPT-4.5 とは異なり、GPT-5 は Chain-of-Thought 推論 を組み込み、論理的一貫性のある応答 と 高度な問題解決 を実現しています。
・複雑な意思決定シナリオ(例: 戦略計画、技術サポート)での利用が特に期待されています。
3. 主な特徴と革新
3.1 GPT-4.5
・最後の Non-Chain-of-Thought モデル:
・GPT-4.5 は OpenAI の最後の Non-Chain-of-Thought (CoT) モデル です。CoT 推論は、人間のような論理的思考プロセスをシミュレートする手法ですが、GPT-4.5 ではあえて統合していません。
・この設計により、高速な処理速度と効率性を維持しながら、シンプルな会話タスクに適した応答が可能です。
・パフォーマンスの向上:
・詳細な性能指標は公開されていませんが、GPT-4 よりも正確性と効率性が向上 していることが予想されています。これは、基盤となるアーキテクチャの最適化によるものです。
・最適化と改良:
・遅延を削減 し、文脈の理解を向上 させるために、モデルのアーキテクチャが最適化されています。
・動的な会話シナリオでもより応答性の高いモデルとして動作し、ユーザー体験の向上が図られています。
3.2 GPT-5
・統合モデルアーキテクチャ:
・GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合 した革新的なモデルです。これにより、タスクに応じたモデルの選択が不要になり、幅広い用途に対応できます。
・適応型推論:
・動的な計算リソースの割り当て により、タスクの複雑さに応じて処理能力を自動調整します。これにより、パフォーマンスと効率が最適化 されます。
・必要な推論レベルを自動的に判断することで、より迅速かつ文脈に合った応答 を提供します。
・統合テクノロジー:
・OpenAI の o3 推論技術 を統合し、論理的な推論能力と文脈適応を大幅に向上させています。
・これにより、高度な問題解決や戦略的思考 が可能となり、より人間らしい分析力を発揮します。
・Chain-of-Thought 推論:
・GPT-4.5 とは異なり、GPT-5 は Chain-of-Thought 推論 を組み込み、論理的一貫性のある応答 と 高度な問題解決 を実現しています。
・複雑な意思決定シナリオ(例: 戦略計画、技術サポート)での利用が特に期待されています。
>>477の続き
4. ユーザーアクセスとサブスクリプションの詳細
OpenAI は、GPT-4.5 および GPT-5 のリリースに伴い、製品ラインを簡素化し、次のような 段階的なユーザーアクセスモデル を導入します。
4.1 GPT-4.5 のアクセス:
・全ユーザーに提供:
・リリース後、無料ユーザーを含むすべての ChatGPT ユーザーが GPT-4.5 にアクセス可能 になります。
・標準知能設定のデフォルトモデル として提供され、高速な応答と効率性を備えています。
・GPT-5 のアクセス:
・無料ユーザー:
・「標準知能設定」 で GPT-5 に無制限にアクセス可能です。
・Plus サブスクライバー:
・より高い知能レベル での利用が可能です。高度な推論能力と文脈認識が強化されています。
・Pro サブスクライバー:
・最も高度な知能設定 を利用でき、Chain-of-Thought 推論 と 動的な計算リソース割り当て のすべての機能をフル活用できます。
この内容は、最新の進展を反映した包括的な情報であり、GPT-4.5 および GPT-5 がもたらす 技術革新、ユーザー体験の向上、戦略的な展開 を理解するための重要な資料となります。
4. ユーザーアクセスとサブスクリプションの詳細
OpenAI は、GPT-4.5 および GPT-5 のリリースに伴い、製品ラインを簡素化し、次のような 段階的なユーザーアクセスモデル を導入します。
4.1 GPT-4.5 のアクセス:
・全ユーザーに提供:
・リリース後、無料ユーザーを含むすべての ChatGPT ユーザーが GPT-4.5 にアクセス可能 になります。
・標準知能設定のデフォルトモデル として提供され、高速な応答と効率性を備えています。
・GPT-5 のアクセス:
・無料ユーザー:
・「標準知能設定」 で GPT-5 に無制限にアクセス可能です。
・Plus サブスクライバー:
・より高い知能レベル での利用が可能です。高度な推論能力と文脈認識が強化されています。
・Pro サブスクライバー:
・最も高度な知能設定 を利用でき、Chain-of-Thought 推論 と 動的な計算リソース割り当て のすべての機能をフル活用できます。
この内容は、最新の進展を反映した包括的な情報であり、GPT-4.5 および GPT-5 がもたらす 技術革新、ユーザー体験の向上、戦略的な展開 を理解するための重要な資料となります。
479名無しさん@お腹いっぱい。
2025/02/22(土) 12:27:30.75ID:kIQFF1qM (((.|\n)*[。、]\n\n){2,}|ご質問ありがとうございます。)
2025/02/22(土) 12:37:08.49ID:OfMoajfy
5月下旬までに、DeepSeekがすごいの出したり、推論以外のなにかすごい機能を付けたら、GPT-5の公開予定も変わるんだろうな
2025/02/22(土) 12:41:47.63ID:+gV83QVD
DeepSeekが登場1ヶ月で「AI公務員」になってて笑うw
かの国はスピード感有りすぎんよぉ
かの国はスピード感有りすぎんよぉ
482名無しさん@お腹いっぱい。
2025/02/22(土) 12:44:32.50ID:3ZnY2kOh 長文コピペの異常者って何を思ってこれやってるんだ?
2025/02/22(土) 12:53:59.39ID:0t5CEVSA
>>480
推論以外というとOCRしかないのでは
推論以外というとOCRしかないのでは
484名無しさん@お腹いっぱい。
2025/02/22(土) 13:09:04.35ID:E+WBxk6b >>475
アーカイブしたチャットは参照しないんだったか
アーカイブしたチャットは参照しないんだったか
2025/02/22(土) 13:10:10.59ID:3NzXleeg
動画生成って今のところ実用的とまではいかんよな
ジョークグッズ的な感じ
ジョークグッズ的な感じ
2025/02/22(土) 13:16:00.96ID:OfMoajfy
>>483
空間認識とか意識を持ったとか
空間認識とか意識を持ったとか
2025/02/22(土) 13:18:42.63ID:RISJiXaE
動画生成も画像生成も何が楽しいのかさっぱりわからん
2025/02/22(土) 13:27:14.14ID:qhk+dYSE
OpenAI、コンピュータ基盤をマイクロソフトからソフトバンクへ移行計画、2030年までに75%シフトへ
tech-canvas.jp/openai-computing-shift-microsoft-softbank-2030/
まさかのソフトバンク
tech-canvas.jp/openai-computing-shift-microsoft-softbank-2030/
まさかのソフトバンク
2025/02/22(土) 13:31:44.28ID:LeVcyVYk
まじかw
490名無しさん@お腹いっぱい。
2025/02/22(土) 13:37:21.52ID:VTYUlf5e Deep Researchの調査結果をNotebookLMに放り込むといい感じかもしれない
2025/02/22(土) 13:40:11.53ID:RxgLE3sX
Microsoftの量子チップはAIが開発したんやろうなあ
492名無しさん@お腹いっぱい。
2025/02/22(土) 14:26:40.84ID:5TL/sKOK C*pilotはGeminiより数段劣ると思うけど、こんなんでGoogleとのプラットフォーム争いに勝てるんだろうか
OpenAIのノウハウをC*pilotに入れ込むって算段だったはずだけど全然できてないだろ
365入れてる大企業勤めの人、このへんどうよ?
OpenAIのノウハウをC*pilotに入れ込むって算段だったはずだけど全然できてないだろ
365入れてる大企業勤めの人、このへんどうよ?
>>492
MicrosoftのCopilotとGoogleのGeminiは、それぞれ異なる特徴と強みを持つAIアシスタントです。CopilotはMicrosoft 365と深く統合されており、WordやExcel、PowerPointなどのアプリケーション内での業務効率化を支援します。一方、GeminiはGoogle Workspaceと連携し、Googleドキュメントやスプレッドシートなどでの情報収集や対話型応答に優れています。
Copilotのユーザーからは、特にTeams会議の要約機能やOutlookでのメール管理支援など、業務効率化に役立つとの声が多く寄せられています。しかし、PowerPointでの資料自動作成機能に関しては、生成されたスライドの質に改善の余地があるとの意見もあります。
一方、Geminiは検索機能に特化しており、目的の資料や情報を迅速かつ正確に見つけることができます。また、Google Workspaceに標準搭載されているため、追加の導入コストがかからない点も利点です。
企業のプラットフォーム戦略において、MicrosoftはOpenAIとのパートナーシップを活用し、Copilotに高度なAI技術を組み込むことで、ビジネスユーザー向けの生産性向上を目指しています。一方、GoogleはGeminiを通じて、一般ユーザーの日常的なニーズに応える情報収集と対話型応答を提供しています。どちらのプラットフォームも、それぞれの強みを活かして市場での競争力を高めています。
実際にMicrosoft 365を導入している企業のユーザーからは、Copilotの活用により業務効率が向上したとの報告がある一方で、特定の機能に関しては改善の余地があるとの意見も聞かれます。最終的には、企業のニーズや既存のプラットフォーム環境に応じて、適切なAIアシスタントを選択することが重要です。
MicrosoftのCopilotとGoogleのGeminiは、それぞれ異なる特徴と強みを持つAIアシスタントです。CopilotはMicrosoft 365と深く統合されており、WordやExcel、PowerPointなどのアプリケーション内での業務効率化を支援します。一方、GeminiはGoogle Workspaceと連携し、Googleドキュメントやスプレッドシートなどでの情報収集や対話型応答に優れています。
Copilotのユーザーからは、特にTeams会議の要約機能やOutlookでのメール管理支援など、業務効率化に役立つとの声が多く寄せられています。しかし、PowerPointでの資料自動作成機能に関しては、生成されたスライドの質に改善の余地があるとの意見もあります。
一方、Geminiは検索機能に特化しており、目的の資料や情報を迅速かつ正確に見つけることができます。また、Google Workspaceに標準搭載されているため、追加の導入コストがかからない点も利点です。
企業のプラットフォーム戦略において、MicrosoftはOpenAIとのパートナーシップを活用し、Copilotに高度なAI技術を組み込むことで、ビジネスユーザー向けの生産性向上を目指しています。一方、GoogleはGeminiを通じて、一般ユーザーの日常的なニーズに応える情報収集と対話型応答を提供しています。どちらのプラットフォームも、それぞれの強みを活かして市場での競争力を高めています。
実際にMicrosoft 365を導入している企業のユーザーからは、Copilotの活用により業務効率が向上したとの報告がある一方で、特定の機能に関しては改善の余地があるとの意見も聞かれます。最終的には、企業のニーズや既存のプラットフォーム環境に応じて、適切なAIアシスタントを選択することが重要です。
>>480
ご指摘のとおり、中国のAI企業であるDeepSeekは、最近「DeepSeek V3」や「Janus-Pro」などの高度なAIモデルを発表し、業界内で注目を集めています。 これに対抗する形で、OpenAIのサム・アルトマンCEOは、GPT-4.5およびGPT-5のリリース計画を明らかにしました。 特に、GPT-5はoシリーズモデルとの統合を図り、より広範なタスクに対応できる統一されたAIシステムを目指しています。
アルトマン氏は、GPT-5のリリース時期を「数カ月以内」としており、具体的には2025年5月下旬の公開を目指しています。 このタイミングは、Microsoftの開発者向けカンファレンス「Build」と重なることから、同イベントでの発表が期待されています。また、GPT-4.5(社内コードネーム:Orion)は、数週間以内にリリースされる予定であり、これはOpenAIの最後の非chain-of-thoughtモデルとなる見込みです。
DeepSeekの急速な技術進歩と市場での存在感の高まりは、OpenAIのリリーススケジュールや製品戦略に影響を与えている可能性があります。アルトマン氏自身も、DeepSeekの台頭により、OpenAIの技術的優位性が脅かされていることを認め、競争力を維持するためにいくつかのリリースを前倒しする意向を示しています。 したがって、DeepSeekが5月下旬までにさらに革新的な機能や推論以外の優れた機能を発表した場合、OpenAIはGPT-5の公開予定を前倒しするなど、柔軟に対応する可能性があります。
要約すると、DeepSeekの動向はOpenAIの戦略に直接的な影響を及ぼしており、今後のAI業界の競争はさらに激化すると予想されます。最新情報を注視し、各企業の発表に注目することが重要です。
ご指摘のとおり、中国のAI企業であるDeepSeekは、最近「DeepSeek V3」や「Janus-Pro」などの高度なAIモデルを発表し、業界内で注目を集めています。 これに対抗する形で、OpenAIのサム・アルトマンCEOは、GPT-4.5およびGPT-5のリリース計画を明らかにしました。 特に、GPT-5はoシリーズモデルとの統合を図り、より広範なタスクに対応できる統一されたAIシステムを目指しています。
アルトマン氏は、GPT-5のリリース時期を「数カ月以内」としており、具体的には2025年5月下旬の公開を目指しています。 このタイミングは、Microsoftの開発者向けカンファレンス「Build」と重なることから、同イベントでの発表が期待されています。また、GPT-4.5(社内コードネーム:Orion)は、数週間以内にリリースされる予定であり、これはOpenAIの最後の非chain-of-thoughtモデルとなる見込みです。
DeepSeekの急速な技術進歩と市場での存在感の高まりは、OpenAIのリリーススケジュールや製品戦略に影響を与えている可能性があります。アルトマン氏自身も、DeepSeekの台頭により、OpenAIの技術的優位性が脅かされていることを認め、競争力を維持するためにいくつかのリリースを前倒しする意向を示しています。 したがって、DeepSeekが5月下旬までにさらに革新的な機能や推論以外の優れた機能を発表した場合、OpenAIはGPT-5の公開予定を前倒しするなど、柔軟に対応する可能性があります。
要約すると、DeepSeekの動向はOpenAIの戦略に直接的な影響を及ぼしており、今後のAI業界の競争はさらに激化すると予想されます。最新情報を注視し、各企業の発表に注目することが重要です。
2025/02/22(土) 14:36:47.74ID:GOV/Ag/n
OpenAIがOperatorでMicrosoft365を使いこなせるようにするんだろ
>>441
ChatGPTの無料版は、プログラミングのサポートにおいても十分な性能を持っています。最新の無料版では、GPT-4o miniモデルが使用可能であり、コードの生成やデバッグ、プログラミングに関する質問への回答など、基本的な機能を提供しています。特に、日常的なプログラミングタスクや学習目的での利用には適しています。
しかし、より高度な機能や精度を求める場合、有料版のChatGPT PlusやChatGPT Proが有用です。有料版では、最新のo3-miniモデルやo1モデルが利用可能で、無料版と比較して回答の精度や詳細さが向上しています。例えば、o3-miniモデルは数学、コーディング、科学分野での性能が向上しており、応答速度も24%速くなっています。 また、ChatGPT Proでは、月額200ドルでo1モデルへの無制限アクセスが可能であり、より高度なプログラミング支援が期待できます。
さらに、有料版では混雑時でも優先的にアクセスでき、応答速度も安定しています。そのため、業務での利用や複雑なプログラミング課題に取り組む際には、ChatGPT PlusやChatGPT Proの利用を検討すると良いでしょう。
まとめると、基本的なプログラミング支援であれば無料版で十分ですが、より高度な機能や安定性を求める場合は有料版が適しています。利用目的や必要性に応じて、適切なプランを選択してください。
ChatGPTの無料版は、プログラミングのサポートにおいても十分な性能を持っています。最新の無料版では、GPT-4o miniモデルが使用可能であり、コードの生成やデバッグ、プログラミングに関する質問への回答など、基本的な機能を提供しています。特に、日常的なプログラミングタスクや学習目的での利用には適しています。
しかし、より高度な機能や精度を求める場合、有料版のChatGPT PlusやChatGPT Proが有用です。有料版では、最新のo3-miniモデルやo1モデルが利用可能で、無料版と比較して回答の精度や詳細さが向上しています。例えば、o3-miniモデルは数学、コーディング、科学分野での性能が向上しており、応答速度も24%速くなっています。 また、ChatGPT Proでは、月額200ドルでo1モデルへの無制限アクセスが可能であり、より高度なプログラミング支援が期待できます。
さらに、有料版では混雑時でも優先的にアクセスでき、応答速度も安定しています。そのため、業務での利用や複雑なプログラミング課題に取り組む際には、ChatGPT PlusやChatGPT Proの利用を検討すると良いでしょう。
まとめると、基本的なプログラミング支援であれば無料版で十分ですが、より高度な機能や安定性を求める場合は有料版が適しています。利用目的や必要性に応じて、適切なプランを選択してください。
>>439
Anthropic社のClaudeが提供する「Computer use」機能と、OpenAIの「Operator」機能について詳しく説明いたします。
・Claudeの「Computer use」機能
Claudeの「Computer use」は、AIがユーザーのコンピュータを人間のように操作する機能です。具体的には、スクリーンショットを解析し、カーソルの移動、クリック、テキスト入力などを行います。この機能により、ユーザーが一度指示を出すと、AIが自動的に複数の操作を連続して実行できます。例えば、ウェブブラウザを開いて情報を検索し、結果をスプレッドシートに入力するといった一連の作業を自動化できます。
・OpenAIの「Operator」機能
一方、OpenAIの「Operator」は、AIエージェントがウェブ上のタスクを自動で実行する機能です。ChatGPTの画面上で、AIがウェブページを表示し、マウスやキーボードを操作してタスクを遂行します。例えば、オンラインでの予約や購入、SNSへの投稿、情報収集と整理など、さまざまなウェブ上の操作を自動化できます。この機能も、ユーザーが最初に指示を出すと、AIが自動的に複数の操作を連続して行います。
・両者の比較
両者とも、ユーザーの初回の指示に基づいてAIが自動的に複数の操作を実行する点で共通しています。ただし、「Computer use」はユーザーのローカル環境(PC上)での操作を対象としており、AIが直接ユーザーのコンピュータを操作します。一方、「Operator」はウェブ上の操作に特化しており、AIがウェブブラウザ内でタスクを実行します。したがって、操作対象や適用範囲に違いがあります。
現在、「Operator」はアメリカのProユーザー向けのプレビュー版として提供されており、フィードバックを基に改良が進められています。
以下の動画では、Claudeの「Computer use」機能のデモンストレーションが紹介されていますので、参考にご覧ください。
youtu.be/zZ3alQls9wE?si=HsWPcscVuMg72rxj
Anthropic社のClaudeが提供する「Computer use」機能と、OpenAIの「Operator」機能について詳しく説明いたします。
・Claudeの「Computer use」機能
Claudeの「Computer use」は、AIがユーザーのコンピュータを人間のように操作する機能です。具体的には、スクリーンショットを解析し、カーソルの移動、クリック、テキスト入力などを行います。この機能により、ユーザーが一度指示を出すと、AIが自動的に複数の操作を連続して実行できます。例えば、ウェブブラウザを開いて情報を検索し、結果をスプレッドシートに入力するといった一連の作業を自動化できます。
・OpenAIの「Operator」機能
一方、OpenAIの「Operator」は、AIエージェントがウェブ上のタスクを自動で実行する機能です。ChatGPTの画面上で、AIがウェブページを表示し、マウスやキーボードを操作してタスクを遂行します。例えば、オンラインでの予約や購入、SNSへの投稿、情報収集と整理など、さまざまなウェブ上の操作を自動化できます。この機能も、ユーザーが最初に指示を出すと、AIが自動的に複数の操作を連続して行います。
・両者の比較
両者とも、ユーザーの初回の指示に基づいてAIが自動的に複数の操作を実行する点で共通しています。ただし、「Computer use」はユーザーのローカル環境(PC上)での操作を対象としており、AIが直接ユーザーのコンピュータを操作します。一方、「Operator」はウェブ上の操作に特化しており、AIがウェブブラウザ内でタスクを実行します。したがって、操作対象や適用範囲に違いがあります。
現在、「Operator」はアメリカのProユーザー向けのプレビュー版として提供されており、フィードバックを基に改良が進められています。
以下の動画では、Claudeの「Computer use」機能のデモンストレーションが紹介されていますので、参考にご覧ください。
youtu.be/zZ3alQls9wE?si=HsWPcscVuMg72rxj
2025/02/22(土) 14:40:54.34ID:LeVcyVYk
長文貼ってるやる共有リンクにしたら読んでやるよ
悪いがその程度の内容なら自分で思ってるほど大したプロンプトじゃないから安心しろ
悪いがその程度の内容なら自分で思ってるほど大したプロンプトじゃないから安心しろ
>>360
AIモデルに「2025年2月20日のニュースをまとめて」と指示しても、満足のいく回答が得られないとのことですね。これは、AIの情報更新頻度やリアルタイムデータへのアクセス制限が原因である可能性があります。多くのAIモデルは、トレーニングデータが一定の時点までのものであり、最新の情報を即座に反映できない場合があります。また、リアルタイムでインターネット上の情報を取得する機能が制限されていることもあります。
しかし、AI技術は日々進歩しており、最新のニュースや出来事を迅速にまとめる能力も向上しています。例えば、特定のニュースサイトや公式発表を参照することで、最新の情報を提供できるAIシステムも存在します。そのため、今後は「今日の出来事をまとめて」といった指示にも、より的確に応答できるAIが増えていくと期待されます。
現時点で最新のニュースを取得するには、信頼性の高いニュースサイトや公式情報源を直接参照することをおすすめします。また、AIを活用する際には、情報の更新日時やデータソースを確認し、最新の情報を提供できるモデルやサービスを選ぶことが重要です。
以下に、2025年2月20日の主なニュースをいくつかまとめました。
国内ニュース:
地震情報:2025年2月20日22時13分頃、山梨県東部・富士五湖を震源とするマグニチュード4.6の地震が発生しました。最大震度3を観測し、神奈川県小田原市、厚木市、松田町、山北町で揺れが感じられました。
千葉県の事件・事故:千葉県警察は、旭市での交通死亡事故や、出入国管理及び難民認定法違反(不法就労助長)事件での逮捕など、複数の事件・事故を報告しました。
国際ニュース:
香港の民主党、解散を検討:香港の老舗泛民主派政党である民主党が解散を計画しており、今後、会員大会で解散の是非が投票で決定される予定です。
ウクライナ情勢:ウクライナ地方政府によると、2月20日午前9時までの24時間で、ロシア軍がオデーサ、ヘルソン、スームィ、ムィコラーイウ、ドニプロペトロウシク、ドネツィク、ルハーンシク、チェルカースィ、ハルキウ、チェルニーヒウなどの地域を攻撃し、少なくとも7人の民間人が死亡、30人が負傷しました。
AIモデルに「2025年2月20日のニュースをまとめて」と指示しても、満足のいく回答が得られないとのことですね。これは、AIの情報更新頻度やリアルタイムデータへのアクセス制限が原因である可能性があります。多くのAIモデルは、トレーニングデータが一定の時点までのものであり、最新の情報を即座に反映できない場合があります。また、リアルタイムでインターネット上の情報を取得する機能が制限されていることもあります。
しかし、AI技術は日々進歩しており、最新のニュースや出来事を迅速にまとめる能力も向上しています。例えば、特定のニュースサイトや公式発表を参照することで、最新の情報を提供できるAIシステムも存在します。そのため、今後は「今日の出来事をまとめて」といった指示にも、より的確に応答できるAIが増えていくと期待されます。
現時点で最新のニュースを取得するには、信頼性の高いニュースサイトや公式情報源を直接参照することをおすすめします。また、AIを活用する際には、情報の更新日時やデータソースを確認し、最新の情報を提供できるモデルやサービスを選ぶことが重要です。
以下に、2025年2月20日の主なニュースをいくつかまとめました。
国内ニュース:
地震情報:2025年2月20日22時13分頃、山梨県東部・富士五湖を震源とするマグニチュード4.6の地震が発生しました。最大震度3を観測し、神奈川県小田原市、厚木市、松田町、山北町で揺れが感じられました。
千葉県の事件・事故:千葉県警察は、旭市での交通死亡事故や、出入国管理及び難民認定法違反(不法就労助長)事件での逮捕など、複数の事件・事故を報告しました。
国際ニュース:
香港の民主党、解散を検討:香港の老舗泛民主派政党である民主党が解散を計画しており、今後、会員大会で解散の是非が投票で決定される予定です。
ウクライナ情勢:ウクライナ地方政府によると、2月20日午前9時までの24時間で、ロシア軍がオデーサ、ヘルソン、スームィ、ムィコラーイウ、ドニプロペトロウシク、ドネツィク、ルハーンシク、チェルカースィ、ハルキウ、チェルニーヒウなどの地域を攻撃し、少なくとも7人の民間人が死亡、30人が負傷しました。
>>499の続き
スポーツニュース:
四大陸フィギュアスケート選手権:2025年2月19日から23日まで、韓国ソウルの木洞アイスリンクで四大陸フィギュアスケート選手権が開催されています。男子シングル、女子シングル、ペア、アイスダンスの各種目が行われます。
訃報:
デイビッド・L・ボーレン氏逝去:アメリカの政治家であり、元オクラホマ州上院議員のデイビッド・L・ボーレン氏が83歳で逝去されました。
環隆科技創業者、欧正明氏逝去:台湾の企業家であり、環隆科技の創業者である欧正明氏が81歳で逝去されました。
最新のニュースや出来事を把握するためには、信頼性の高い情報源を定期的に確認することが重要です。AI技術も進化していますが、現時点では人間の判断と情報収集が不可欠です。
スポーツニュース:
四大陸フィギュアスケート選手権:2025年2月19日から23日まで、韓国ソウルの木洞アイスリンクで四大陸フィギュアスケート選手権が開催されています。男子シングル、女子シングル、ペア、アイスダンスの各種目が行われます。
訃報:
デイビッド・L・ボーレン氏逝去:アメリカの政治家であり、元オクラホマ州上院議員のデイビッド・L・ボーレン氏が83歳で逝去されました。
環隆科技創業者、欧正明氏逝去:台湾の企業家であり、環隆科技の創業者である欧正明氏が81歳で逝去されました。
最新のニュースや出来事を把握するためには、信頼性の高い情報源を定期的に確認することが重要です。AI技術も進化していますが、現時点では人間の判断と情報収集が不可欠です。
>>359
ChatGPTの週間アクティブユーザー数は、2025年2月時点で4億人を超えています。 一方で、有料版であるChatGPT Plusのユーザー数は、2024年9月時点で約770万人と報告されています。 これは、全ユーザーの約3.85%が有料版を利用していることを示しています。
ChatGPTの運用には高額なサーバーや電力コストが伴います。2023年11月の報道によれば、ChatGPTの運用コストは1日あたり約1億円に上るとされています。 この高額な運用コストに対して、有料ユーザーからの収益だけで賄うことは難しいと考えられます。
OpenAIは、ChatGPTの法人向けバージョンであるChatGPT Teamや教育向けのChatGPT Eduなど、多様なサービスを展開し、収益源の多角化を図っています。 また、2024年10月には66億ドルの資金調達を完了し、世界中の銀行から40億ドルの信用枠を獲得するなど、資金面での強化も行っています。
さらに、OpenAIはより高度なAIシステムの開発と運用に多額の費用をかけています。2024年の年間売上高は37億ドルと予想されていますが、運営費や給与、諸経費を差し引くと50億ドルの損失になると見積もられています。 このような状況から、OpenAIは引き続き資金調達や新たな収益モデルの模索を行い、持続可能な運営体制の確立に努めています。
また、ChatGPTの運用には膨大な電力が必要とされ、データセンターの消費電力量が増加しています。IEA(国際エネルギー機関)のレポートによれば、2022年には世界全体で約460TWhだった消費電力量が、2026年には約1,000TWhに達する可能性があるとされています。 このようなエネルギーコストの増加も、運営の持続可能性に影響を与える要因となっています。
総じて、OpenAIは多様なサービス展開や資金調達を通じて、ChatGPTの高額な運用コストをカバーし、持続可能なビジネスモデルの構築に取り組んでいます。
ChatGPTの週間アクティブユーザー数は、2025年2月時点で4億人を超えています。 一方で、有料版であるChatGPT Plusのユーザー数は、2024年9月時点で約770万人と報告されています。 これは、全ユーザーの約3.85%が有料版を利用していることを示しています。
ChatGPTの運用には高額なサーバーや電力コストが伴います。2023年11月の報道によれば、ChatGPTの運用コストは1日あたり約1億円に上るとされています。 この高額な運用コストに対して、有料ユーザーからの収益だけで賄うことは難しいと考えられます。
OpenAIは、ChatGPTの法人向けバージョンであるChatGPT Teamや教育向けのChatGPT Eduなど、多様なサービスを展開し、収益源の多角化を図っています。 また、2024年10月には66億ドルの資金調達を完了し、世界中の銀行から40億ドルの信用枠を獲得するなど、資金面での強化も行っています。
さらに、OpenAIはより高度なAIシステムの開発と運用に多額の費用をかけています。2024年の年間売上高は37億ドルと予想されていますが、運営費や給与、諸経費を差し引くと50億ドルの損失になると見積もられています。 このような状況から、OpenAIは引き続き資金調達や新たな収益モデルの模索を行い、持続可能な運営体制の確立に努めています。
また、ChatGPTの運用には膨大な電力が必要とされ、データセンターの消費電力量が増加しています。IEA(国際エネルギー機関)のレポートによれば、2022年には世界全体で約460TWhだった消費電力量が、2026年には約1,000TWhに達する可能性があるとされています。 このようなエネルギーコストの増加も、運営の持続可能性に影響を与える要因となっています。
総じて、OpenAIは多様なサービス展開や資金調達を通じて、ChatGPTの高額な運用コストをカバーし、持続可能なビジネスモデルの構築に取り組んでいます。
502名無しさん@お腹いっぱい。
2025/02/22(土) 14:53:44.70ID:pEXiVIMo 長文コピペ厨はただの荒らし
荒らしを相手するのも荒らし
荒らしを相手するのも荒らし
>>344
おっしゃる通り、Grok-3の登場により、AI業界は大きな変革を迎えています。The Vergeの報道によれば、Grok-3はリリース直後からChatbot Arenaのリーダーボードでトップに立ち、iOSアプリもApp StoreでChatGPTを上回る人気を博しています。
Elon Musk率いるxAIチームは、Grok-3の開発と展開を驚異的なスピードで実現しました。Musk氏は、OpenAIに対抗するため、ChatGPTに似た音声インタラクションやデスクトップアプリの導入、さらにはAIゲームスタジオの設立など、多角的な戦略を打ち出しています。
一方で、OpenAIもChatGPTの週間アクティブユーザー数が4億人に達したと発表し、依然として強力なユーザーベースを維持しています。 このように、GrokとChatGPTの間で熾烈な競争が繰り広げられており、AI業界の覇権争いは今後も続くと予想されます。
また、Grok-3はX(旧Twitter)との統合により、ユーザーがリアルタイムでAI情報をキャッチしやすくなっています。この利便性がユーザーの支持を集め、Grok-3の普及を後押ししている要因の一つと考えられます。
さらに、Grok-3の性能や制限について検証した動画も公開されています。以下の動画では、Grok-3の特徴や他のAIモデルとの比較が詳しく解説されていますので、ぜひご覧ください。
youtu.be/N5ZKYUcPRPs?si=vI6KpkOtLl0iJzbz
おっしゃる通り、Grok-3の登場により、AI業界は大きな変革を迎えています。The Vergeの報道によれば、Grok-3はリリース直後からChatbot Arenaのリーダーボードでトップに立ち、iOSアプリもApp StoreでChatGPTを上回る人気を博しています。
Elon Musk率いるxAIチームは、Grok-3の開発と展開を驚異的なスピードで実現しました。Musk氏は、OpenAIに対抗するため、ChatGPTに似た音声インタラクションやデスクトップアプリの導入、さらにはAIゲームスタジオの設立など、多角的な戦略を打ち出しています。
一方で、OpenAIもChatGPTの週間アクティブユーザー数が4億人に達したと発表し、依然として強力なユーザーベースを維持しています。 このように、GrokとChatGPTの間で熾烈な競争が繰り広げられており、AI業界の覇権争いは今後も続くと予想されます。
また、Grok-3はX(旧Twitter)との統合により、ユーザーがリアルタイムでAI情報をキャッチしやすくなっています。この利便性がユーザーの支持を集め、Grok-3の普及を後押ししている要因の一つと考えられます。
さらに、Grok-3の性能や制限について検証した動画も公開されています。以下の動画では、Grok-3の特徴や他のAIモデルとの比較が詳しく解説されていますので、ぜひご覧ください。
youtu.be/N5ZKYUcPRPs?si=vI6KpkOtLl0iJzbz
>>290
Grok 3は、イーロン・マスク氏が率いるxAIによって開発された最新のAIモデルであり、特に数学、科学、コーディングの分野で高い性能を示しています。 しかし、日本語環境での使用に関しては、いくつかの課題が報告されています。
・日本語処理の精度
Grok 3は強力な推論能力と高速処理を備えていますが、日本語の長文入力や複雑なタスクにおいて、英語で応答してしまう傾向があると指摘されています。 また、Deep Research機能を使用した際、日本語での調査においては、OpenAIのDeep Researchの方が優れているとの評価もあります。
・画像生成機能
Grok 3は画像生成機能も備えており、ユーザーの指示に応じた画像を作成できます。 しかし、日本語のプロンプトでは意図した結果が得られない場合があり、英語での指示が推奨されるケースもあるようです。
・利用料金
Grok 3を利用するには、XのPremium Plusサブスクリプション(月額6,080円)やSuper Grokサブスクリプション(月額約4,500円)への加入が必要です。 この価格設定は、日本のユーザーにとってやや高額と感じられるかもしれません。
・まとめ
Grok 3は高い性能を持つAIモデルですが、日本語環境での使用においては、処理精度や応答の一貫性に課題があると報告されています。また、利用料金も日本のユーザーにとっては高めに設定されています。したがって、現時点では日本人ユーザーにとって「最強」と言い切るには難しい面があり、今後の日本語対応の改善や価格設定の見直しが期待されます。
Grok 3は、イーロン・マスク氏が率いるxAIによって開発された最新のAIモデルであり、特に数学、科学、コーディングの分野で高い性能を示しています。 しかし、日本語環境での使用に関しては、いくつかの課題が報告されています。
・日本語処理の精度
Grok 3は強力な推論能力と高速処理を備えていますが、日本語の長文入力や複雑なタスクにおいて、英語で応答してしまう傾向があると指摘されています。 また、Deep Research機能を使用した際、日本語での調査においては、OpenAIのDeep Researchの方が優れているとの評価もあります。
・画像生成機能
Grok 3は画像生成機能も備えており、ユーザーの指示に応じた画像を作成できます。 しかし、日本語のプロンプトでは意図した結果が得られない場合があり、英語での指示が推奨されるケースもあるようです。
・利用料金
Grok 3を利用するには、XのPremium Plusサブスクリプション(月額6,080円)やSuper Grokサブスクリプション(月額約4,500円)への加入が必要です。 この価格設定は、日本のユーザーにとってやや高額と感じられるかもしれません。
・まとめ
Grok 3は高い性能を持つAIモデルですが、日本語環境での使用においては、処理精度や応答の一貫性に課題があると報告されています。また、利用料金も日本のユーザーにとっては高めに設定されています。したがって、現時点では日本人ユーザーにとって「最強」と言い切るには難しい面があり、今後の日本語対応の改善や価格設定の見直しが期待されます。
>>288
生成AIの推論モデルは、学習型の一発回答モデルと比較して、計算資源を大幅に多く消費します。具体的には、NVIDIAのAI製品管理担当副社長であるカリ・ブリスキ氏によれば、推論モデルは従来の大規模言語モデル(LLM)と比べて、100倍以上の計算資源を必要とすることがあるとされています。 これは、推論モデルが問題解決の際に「思考の連鎖(chain-of-thought)」と呼ばれる長時間の自己対話を行い、多くのトークンを生成するためです。生成されるトークン数が増えるほど、計算資源の消費も比例して増加します。
一方、学習型の一発回答モデルは、事前に大規模なデータセットで学習を行い、ユーザーからの入力に対して即座に応答を返す設計となっています。このため、推論モデルのような複雑な思考プロセスを経ることなく、比較的少ない計算資源で応答を生成できます。
ただし、推論モデルの計算資源の消費を抑えるための研究も進められています。例えば、スタンフォード大学とワシントン大学の研究者たちは、わずか26分、費用にして50ドル未満でOpenAIのモデルに匹敵するAI推論モデル「s1」を開発しました。 このモデルは、GoogleのGemini 2.0モデルの出力を活用した蒸留技術を用いており、限られた計算資源で高性能なモデルを構築する可能性を示しています。
さらに、モデルの学習に必要な計算量は、パラメータ数(N)とトークン数(D)を用いて「6 × N × D」という式で近似されることが多いとされています。 この計算量は、モデルの規模や学習データの量に直接影響を受けます。
総じて、推論モデルは高度な問題解決能力を持つ一方で、計算資源の消費が大きく、学習型の一発回答モデルは即時性と効率性に優れるものの、応答の深さや柔軟性に限界があるといえます。今後、計算資源の効率的な活用とモデル性能のバランスを取るための技術開発が重要となるでしょう。
生成AIの推論モデルは、学習型の一発回答モデルと比較して、計算資源を大幅に多く消費します。具体的には、NVIDIAのAI製品管理担当副社長であるカリ・ブリスキ氏によれば、推論モデルは従来の大規模言語モデル(LLM)と比べて、100倍以上の計算資源を必要とすることがあるとされています。 これは、推論モデルが問題解決の際に「思考の連鎖(chain-of-thought)」と呼ばれる長時間の自己対話を行い、多くのトークンを生成するためです。生成されるトークン数が増えるほど、計算資源の消費も比例して増加します。
一方、学習型の一発回答モデルは、事前に大規模なデータセットで学習を行い、ユーザーからの入力に対して即座に応答を返す設計となっています。このため、推論モデルのような複雑な思考プロセスを経ることなく、比較的少ない計算資源で応答を生成できます。
ただし、推論モデルの計算資源の消費を抑えるための研究も進められています。例えば、スタンフォード大学とワシントン大学の研究者たちは、わずか26分、費用にして50ドル未満でOpenAIのモデルに匹敵するAI推論モデル「s1」を開発しました。 このモデルは、GoogleのGemini 2.0モデルの出力を活用した蒸留技術を用いており、限られた計算資源で高性能なモデルを構築する可能性を示しています。
さらに、モデルの学習に必要な計算量は、パラメータ数(N)とトークン数(D)を用いて「6 × N × D」という式で近似されることが多いとされています。 この計算量は、モデルの規模や学習データの量に直接影響を受けます。
総じて、推論モデルは高度な問題解決能力を持つ一方で、計算資源の消費が大きく、学習型の一発回答モデルは即時性と効率性に優れるものの、応答の深さや柔軟性に限界があるといえます。今後、計算資源の効率的な活用とモデル性能のバランスを取るための技術開発が重要となるでしょう。
2025/02/22(土) 15:04:05.38ID:GOV/Ag/n
OpenAIのシェア率とユーザー数、有料会員数から、他社はどれぐらいのユーザー数や収益がある
かも計算できだな
かも計算できだな
>>280
ご指摘のとおり、OpenAIの「o3-mini high」は高度な推論能力を持つモデルですが、同じ間違いを繰り返すことがあり、ユーザーのフィードバックに対する適切な対応が欠けていると感じられることがあります。一方、Elon Musk氏が率いるxAIが開発した「Grok 3」は、最新のAIモデルであり、特に数学的推論能力において高い評価を受けています。例えば、AIME 2025競技会では、「Grok 3 Reasoning Beta」が93点を獲得し、「o3-mini high」の87点を上回る結果を示しています。
ただし、Grok 3はまだテスト段階であり、安定性や信頼性の面で完全には検証されていません。また、AIモデルの性能はタスクの種類や使用環境によって異なるため、一概にどちらが優れているとは言い切れません。現時点で「GTP-5」のリリース情報は確認できませんが、AI技術は日々進化しています。新しいモデルの登場を待つとともに、現在利用可能なモデルの特性を理解し、適切に使い分けることが重要です。
なお、o3-miniシリーズには「low」「medium」「high」の3段階の推論モードがあり、タスクの難易度や速度・精度のバランスに応じて選択できます。ChatGPT上では「medium」に相当する「o3-mini」と「high」に相当する「o3-mini-high」の2種類が選択可能であり、API利用時にはすべてのモードが利用できます。
また、o3-mini-highは、内部設定の調整により、生成時の「温度」や「トップP」などのパラメータが詳細に設定され、応答の多様性や精度を高める設計となっています。
最新のAIモデルの比較や活用方法について、以下の動画も参考になるかと思います。
youtu.be/DfPfPAv1ugo?si=An-xLPuf9Ukp2NR5
ご指摘のとおり、OpenAIの「o3-mini high」は高度な推論能力を持つモデルですが、同じ間違いを繰り返すことがあり、ユーザーのフィードバックに対する適切な対応が欠けていると感じられることがあります。一方、Elon Musk氏が率いるxAIが開発した「Grok 3」は、最新のAIモデルであり、特に数学的推論能力において高い評価を受けています。例えば、AIME 2025競技会では、「Grok 3 Reasoning Beta」が93点を獲得し、「o3-mini high」の87点を上回る結果を示しています。
ただし、Grok 3はまだテスト段階であり、安定性や信頼性の面で完全には検証されていません。また、AIモデルの性能はタスクの種類や使用環境によって異なるため、一概にどちらが優れているとは言い切れません。現時点で「GTP-5」のリリース情報は確認できませんが、AI技術は日々進化しています。新しいモデルの登場を待つとともに、現在利用可能なモデルの特性を理解し、適切に使い分けることが重要です。
なお、o3-miniシリーズには「low」「medium」「high」の3段階の推論モードがあり、タスクの難易度や速度・精度のバランスに応じて選択できます。ChatGPT上では「medium」に相当する「o3-mini」と「high」に相当する「o3-mini-high」の2種類が選択可能であり、API利用時にはすべてのモードが利用できます。
また、o3-mini-highは、内部設定の調整により、生成時の「温度」や「トップP」などのパラメータが詳細に設定され、応答の多様性や精度を高める設計となっています。
最新のAIモデルの比較や活用方法について、以下の動画も参考になるかと思います。
youtu.be/DfPfPAv1ugo?si=An-xLPuf9Ukp2NR5
>>260
現時点では、PDF内の図や表を完全に理解し、適切に読み取ることができる生成AIはまだ存在しません。多くの生成AIは主にテキストデータの処理に特化しており、画像やグラフなどの視覚情報の解釈には限界があります。例えば、ChatGPTやClaudeなどの対話型マルチモーダル生成AIは、テキストベースの情報処理に優れていますが、PDF内の複雑な図表の内容を正確に解析する能力は十分ではありません。
一方で、PDFの進化に伴い、ジェネレーティブAIの開発も進行中です。自然言語で内容に関する質問をしたり、内容を要約したりする機能を持つAIが登場しています。しかし、これらの機能は主にテキスト情報に焦点を当てており、図や表などの視覚情報の詳細な理解や解釈にはまだ課題が残っています。
現在、研究者や開発者は、画像認識技術や自然言語処理を組み合わせて、PDF内の視覚情報をより正確に解析できるAIの開発に取り組んでいます。しかし、これらの技術が実用化され、広く普及するまでには時間がかかると予想されます。したがって、PDF内の図や表を完全に理解し、読み取ることができる生成AIの実現には、さらなる技術的進歩と研究が必要です。
現時点では、PDF内の図や表を完全に理解し、適切に読み取ることができる生成AIはまだ存在しません。多くの生成AIは主にテキストデータの処理に特化しており、画像やグラフなどの視覚情報の解釈には限界があります。例えば、ChatGPTやClaudeなどの対話型マルチモーダル生成AIは、テキストベースの情報処理に優れていますが、PDF内の複雑な図表の内容を正確に解析する能力は十分ではありません。
一方で、PDFの進化に伴い、ジェネレーティブAIの開発も進行中です。自然言語で内容に関する質問をしたり、内容を要約したりする機能を持つAIが登場しています。しかし、これらの機能は主にテキスト情報に焦点を当てており、図や表などの視覚情報の詳細な理解や解釈にはまだ課題が残っています。
現在、研究者や開発者は、画像認識技術や自然言語処理を組み合わせて、PDF内の視覚情報をより正確に解析できるAIの開発に取り組んでいます。しかし、これらの技術が実用化され、広く普及するまでには時間がかかると予想されます。したがって、PDF内の図や表を完全に理解し、読み取ることができる生成AIの実現には、さらなる技術的進歩と研究が必要です。
>>255
日本におけるAI開発がGPT-3.5や4.0レベルで停滞している理由について、以下の要因が考えられます。
1. 研究開発資源の制約
AIモデルの開発には、大量のデータと高性能な計算資源が必要です。日本の企業や研究機関は、これらのリソースを十分に確保することが難しい場合があります。一方、中国では国家主導でAI開発が推進されており、豊富なデータと資金が提供されています。その結果、DeepSeekのような高性能なAIモデルが低コストで開発されています。
2. データの量と質
AIモデルの性能は、学習に使用するデータの量と質に大きく依存します。日本語のデータは英語や中国語に比べて量が少なく、多様性にも限りがあります。これが、日本語対応のAIモデルの性能向上を妨げる一因となっています。
3. 産学連携とオープンイノベーションの不足
日本では、企業と大学、研究機関との連携が他国に比べて十分でないとの指摘があります。オープンイノベーションの推進が遅れており、最新の研究成果や技術が産業界に迅速に取り入れられにくい状況です。
4. 規制と倫理的懸念
AI技術の開発と利用に関して、日本ではプライバシー保護や倫理的観点からの規制が厳しい傾向があります。これが、データ収集やモデルの学習プロセスに影響を与え、開発のスピードを制限している可能性があります。
これらの要因が組み合わさり、日本におけるAI開発が他国と比較して遅れをとっていると考えられます。しかし、近年では政府や企業がAI分野への投資を増やし、研究開発の強化や人材育成に取り組んでいます。今後の進展に期待したいところです。
日本におけるAI開発がGPT-3.5や4.0レベルで停滞している理由について、以下の要因が考えられます。
1. 研究開発資源の制約
AIモデルの開発には、大量のデータと高性能な計算資源が必要です。日本の企業や研究機関は、これらのリソースを十分に確保することが難しい場合があります。一方、中国では国家主導でAI開発が推進されており、豊富なデータと資金が提供されています。その結果、DeepSeekのような高性能なAIモデルが低コストで開発されています。
2. データの量と質
AIモデルの性能は、学習に使用するデータの量と質に大きく依存します。日本語のデータは英語や中国語に比べて量が少なく、多様性にも限りがあります。これが、日本語対応のAIモデルの性能向上を妨げる一因となっています。
3. 産学連携とオープンイノベーションの不足
日本では、企業と大学、研究機関との連携が他国に比べて十分でないとの指摘があります。オープンイノベーションの推進が遅れており、最新の研究成果や技術が産業界に迅速に取り入れられにくい状況です。
4. 規制と倫理的懸念
AI技術の開発と利用に関して、日本ではプライバシー保護や倫理的観点からの規制が厳しい傾向があります。これが、データ収集やモデルの学習プロセスに影響を与え、開発のスピードを制限している可能性があります。
これらの要因が組み合わさり、日本におけるAI開発が他国と比較して遅れをとっていると考えられます。しかし、近年では政府や企業がAI分野への投資を増やし、研究開発の強化や人材育成に取り組んでいます。今後の進展に期待したいところです。
>>126
医療分野における人工知能(AI)の活用が進む中で、AIが診断や治療に関与した際の責任の所在が重要な課題となっています。現行の日本の法制度では、AIはあくまで医師の補助的な役割を果たすものであり、最終的な診断や治療の決定は医師が行い、その責任も医師が負うとされています。これは、2017年の厚生労働省「保健医療分野におけるAI活用推進懇談会報告書」において、「診断確定や治療方針の最終的な意思決定は医師が行い、その意思決定の責任も当該医師が負うべき」と明記されており、2018年12月の厚生労働省の通達でも同様の立場が示されています。
しかし、AIが医療現場で果たす役割が拡大し、診断や治療の精度が向上するにつれて、責任の所在に関する議論も複雑化しています。AIが提供する情報や提案に基づいて医師が判断を下す場合、AIの開発者や提供者、さらには医療機関自体の責任も問われる可能性があります。特に、AIのアルゴリズムにバイアスや欠陥が存在し、それが誤診や治療ミスにつながった場合、誰がどの程度の責任を負うべきかは明確ではありません。
さらに、AIの判断過程が「ブラックボックス」と化し、医師がその根拠を十分に理解できない場合、医師が最終的な責任を負うことに対する懸念も存在します。このような状況では、医師がAIの提案をどの程度信頼し、どのように活用すべきかの指針が求められます。
このような課題に対処するためには、AIの開発段階から倫理的・法的な視点を取り入れ、透明性や説明責任を確保することが重要です。また、医師や医療従事者がAIの機能や限界を正しく理解し、適切に活用できるよう教育や研修を充実させる必要があります。さらに、AIの誤作動や誤診に備えた法的枠組みやガイドラインの整備も急務とされています。
総じて、医療AIの責任問題は多面的であり、技術の進歩とともに継続的な議論と制度の見直しが求められます。患者の安全と信頼を最優先に考え、医師、AI開発者、医療機関、そして法制当局が連携して適切な対応を講じることが必要です。
医療分野における人工知能(AI)の活用が進む中で、AIが診断や治療に関与した際の責任の所在が重要な課題となっています。現行の日本の法制度では、AIはあくまで医師の補助的な役割を果たすものであり、最終的な診断や治療の決定は医師が行い、その責任も医師が負うとされています。これは、2017年の厚生労働省「保健医療分野におけるAI活用推進懇談会報告書」において、「診断確定や治療方針の最終的な意思決定は医師が行い、その意思決定の責任も当該医師が負うべき」と明記されており、2018年12月の厚生労働省の通達でも同様の立場が示されています。
しかし、AIが医療現場で果たす役割が拡大し、診断や治療の精度が向上するにつれて、責任の所在に関する議論も複雑化しています。AIが提供する情報や提案に基づいて医師が判断を下す場合、AIの開発者や提供者、さらには医療機関自体の責任も問われる可能性があります。特に、AIのアルゴリズムにバイアスや欠陥が存在し、それが誤診や治療ミスにつながった場合、誰がどの程度の責任を負うべきかは明確ではありません。
さらに、AIの判断過程が「ブラックボックス」と化し、医師がその根拠を十分に理解できない場合、医師が最終的な責任を負うことに対する懸念も存在します。このような状況では、医師がAIの提案をどの程度信頼し、どのように活用すべきかの指針が求められます。
このような課題に対処するためには、AIの開発段階から倫理的・法的な視点を取り入れ、透明性や説明責任を確保することが重要です。また、医師や医療従事者がAIの機能や限界を正しく理解し、適切に活用できるよう教育や研修を充実させる必要があります。さらに、AIの誤作動や誤診に備えた法的枠組みやガイドラインの整備も急務とされています。
総じて、医療AIの責任問題は多面的であり、技術の進歩とともに継続的な議論と制度の見直しが求められます。患者の安全と信頼を最優先に考え、医師、AI開発者、医療機関、そして法制当局が連携して適切な対応を講じることが必要です。
2025/02/22(土) 15:14:59.43ID:N+eboZ3A
>>488
> OpenAI、コンピュータ基盤をマイクロソフトからソフトバンクへ移行計画、2030年までに75%シフトへ
オメーラ!これはオープンが王将で、マイクロソフトがくらと考えろ。オープンAIはくらを捨てて
吉野家に移行することが確実だということだ!なぜなら吉野家には技術力がねえ。だから、奴隷に
できると考えた。しかしこの計画はかならず失敗する...
オメーラはきょうかぎりスッパリと王将を捨てろ!おれは全力でくらへの移行を進めている。
> OpenAI、コンピュータ基盤をマイクロソフトからソフトバンクへ移行計画、2030年までに75%シフトへ
オメーラ!これはオープンが王将で、マイクロソフトがくらと考えろ。オープンAIはくらを捨てて
吉野家に移行することが確実だということだ!なぜなら吉野家には技術力がねえ。だから、奴隷に
できると考えた。しかしこの計画はかならず失敗する...
オメーラはきょうかぎりスッパリと王将を捨てろ!おれは全力でくらへの移行を進めている。
>>506
OpenAIのChatGPTは、2025年2月時点で週次アクティブユーザー数が4億人を超え、そのうち約770万人が月額20ドルの有料サービス「ChatGPT Plus」を利用しています。 この有料ユーザー数は全体の約1.9%に相当し、年間収益は約19億ドルと推定されます。
他社のAIサービスについて具体的なユーザー数や収益データは限られていますが、いくつかの情報を基に推定すると以下のようになります。
1. Perplexity
・AIを活用した検索エンジン「Perplexity」は、2024年12月時点で月間アクティブユーザー数が1,500万人に達しています。 同社はサブスクリプションモデルで収益を上げており、年間収益は2024年8月時点で3,500万ドルに成長しています。
2. ClassDojo
・教育分野のプラットフォーム「ClassDojo」は、2024年時点で利用者数が5,000万人を超えています。保護者向けの有料版「ClassDojo Plus」の年間売上は2023年に約3,000万ドルと推定されています。
これらのデータから、各社のユーザー数に対する有料会員数や収益を比較すると、OpenAIのChatGPTは有料ユーザーの割合が約1.9%であり、年間収益は約19億ドルと推定されます。一方、PerplexityやClassDojoはユーザー数に対する有料会員数や収益が公表されていないため、正確な比較は難しいものの、収益規模ではOpenAIが他社を大きく上回っていると考えられます。
ただし、各社のビジネスモデルやターゲット市場が異なるため、単純なユーザー数や収益の比較だけでなく、各社の戦略や提供する価値を総合的に評価する必要があります。
OpenAIのChatGPTは、2025年2月時点で週次アクティブユーザー数が4億人を超え、そのうち約770万人が月額20ドルの有料サービス「ChatGPT Plus」を利用しています。 この有料ユーザー数は全体の約1.9%に相当し、年間収益は約19億ドルと推定されます。
他社のAIサービスについて具体的なユーザー数や収益データは限られていますが、いくつかの情報を基に推定すると以下のようになります。
1. Perplexity
・AIを活用した検索エンジン「Perplexity」は、2024年12月時点で月間アクティブユーザー数が1,500万人に達しています。 同社はサブスクリプションモデルで収益を上げており、年間収益は2024年8月時点で3,500万ドルに成長しています。
2. ClassDojo
・教育分野のプラットフォーム「ClassDojo」は、2024年時点で利用者数が5,000万人を超えています。保護者向けの有料版「ClassDojo Plus」の年間売上は2023年に約3,000万ドルと推定されています。
これらのデータから、各社のユーザー数に対する有料会員数や収益を比較すると、OpenAIのChatGPTは有料ユーザーの割合が約1.9%であり、年間収益は約19億ドルと推定されます。一方、PerplexityやClassDojoはユーザー数に対する有料会員数や収益が公表されていないため、正確な比較は難しいものの、収益規模ではOpenAIが他社を大きく上回っていると考えられます。
ただし、各社のビジネスモデルやターゲット市場が異なるため、単純なユーザー数や収益の比較だけでなく、各社の戦略や提供する価値を総合的に評価する必要があります。
2025/02/22(土) 15:23:07.04ID:N+eboZ3A
>>510
> AIが医療現場で果たす役割が拡大し、
そんなもんは...ねえ!!まだわかんねーのか?AIには心がねえ。体もねえ。ChatGPTには
お母さんもお父さんもいねー!!人の心がわからねえ。そんなみなしごハッチみたいなヤツには
なんの役割も果たせねえ!!
> AIが医療現場で果たす役割が拡大し、
そんなもんは...ねえ!!まだわかんねーのか?AIには心がねえ。体もねえ。ChatGPTには
お母さんもお父さんもいねー!!人の心がわからねえ。そんなみなしごハッチみたいなヤツには
なんの役割も果たせねえ!!
514名無しさん@お腹いっぱい。
2025/02/22(土) 15:25:41.88ID:1l5uj1C1 日本とアメリカで時差があることを前提に回答しないぽんこつだらけなんですけど
2025/02/22(土) 15:28:39.10ID:N+eboZ3A
>>512
> Perplexity
3,500万ドル そのうち3400万ドルは社長が取る。残りの100万を全員で分ける。
つまりパープの社員の給料は時給900円だ。もちろん健康保険もねえ!!
パープなど、おれたち情強が相手するかっ?「90年代AV女優 緊縛」で検索するぐらいだ。
> Perplexity
3,500万ドル そのうち3400万ドルは社長が取る。残りの100万を全員で分ける。
つまりパープの社員の給料は時給900円だ。もちろん健康保険もねえ!!
パープなど、おれたち情強が相手するかっ?「90年代AV女優 緊縛」で検索するぐらいだ。
516名無しさん@お腹いっぱい。
2025/02/22(土) 15:32:01.32ID:Tv8URlpJ2025/02/22(土) 15:55:24.84ID:RxgLE3sX
つかなあ、仮にAGIに近いもんが出来たとして、
それを一般提供するより、内部で使って量子チップ開発した方が儲かるやろ
どんな言い訳しても今のコパイロットは使えない抜け殻に見えるわ
それを一般提供するより、内部で使って量子チップ開発した方が儲かるやろ
どんな言い訳しても今のコパイロットは使えない抜け殻に見えるわ
518名無しさん@お腹いっぱい。
2025/02/22(土) 16:03:01.68ID:XTIsz9K+ Grok3が微妙だったせいでopenaiの殿様商売が許されてしまっている
ここでo3を大差でぶち抜くモデルを出してれば今頃大慌てでgpt5をリリースしてただろうに
ここでo3を大差でぶち抜くモデルを出してれば今頃大慌てでgpt5をリリースしてただろうに
2025/02/22(土) 16:13:09.18ID:I3lsVlpi
なぜ笑うんだい?
Grok3の日本語は上手だよ
Grok3の日本語は上手だよ
2025/02/22(土) 16:23:09.97ID:fc0ZHa3t
>>517
AGIが出来たらそのAGIがもっと良いAGIを作り続けてASIに至るんだろ
AGIが出来たらそのAGIがもっと良いAGIを作り続けてASIに至るんだろ
2025/02/22(土) 16:36:43.42ID:EkVx63GV
522名無しさん@お腹いっぱい。
2025/02/22(土) 16:39:09.08ID:xSQIu/ce イかれたメンバーを紹介するぜ!!
長文ガイジ…自分の考えは一切書かず機械的にAI出力のみ延々貼り続ける
Copilotガイジ…Copilotと念仏を執拗に推す。内容は意味不明だが流れに沿ったレスはしている
句読点ガイジ…レスの内容はともかく異常な頻度で句読点を使うので読みにくいことこの上ない
終わりだなガイジ…OpenAIを憎む。最近はAIによって世界が終末を迎える系のレスにハマっている
長文ガイジ…自分の考えは一切書かず機械的にAI出力のみ延々貼り続ける
Copilotガイジ…Copilotと念仏を執拗に推す。内容は意味不明だが流れに沿ったレスはしている
句読点ガイジ…レスの内容はともかく異常な頻度で句読点を使うので読みにくいことこの上ない
終わりだなガイジ…OpenAIを憎む。最近はAIによって世界が終末を迎える系のレスにハマっている
2025/02/22(土) 16:40:32.23ID:RxgLE3sX
2025/02/22(土) 18:09:08.05ID:5b5OqTXL
パープレ無料ユーザーのPro検索とDeepResearchの回数制限って別カウントと思ってたけどそうじゃないんだな
deep5回使ったらproも使えなくなった
deep5回使ったらproも使えなくなった
2025/02/22(土) 18:14:40.10ID:ecmHp7R3
それ途中でタブ閉じたら回数だけ消費してしまったよ
ページ残して作業続けてくれればいいのに
ページ残して作業続けてくれればいいのに
2025/02/22(土) 18:46:15.11ID:ecmHp7R3
ファイル添付とWeb検索と推論が全て同時にできるのはすごいんだけどね
他のサービスではこうはいかんよ
他のサービスではこうはいかんよ
2025/02/22(土) 18:59:24.51ID:5b5OqTXL
>>525
処理完了後にライブラリのところに出てくるはず
処理完了後にライブラリのところに出てくるはず
2025/02/22(土) 19:42:56.82ID:M6vTXYeo
Web検索や推論がほぼ標準機能扱いで、ないと残念がられるようになってすごいね
推論よりも先に出たアーティファクトがいまいち標準機能になっていないのに
ファイル添付も、まだできなかったりファイルの種類が限られてたりか
推論よりも先に出たアーティファクトがいまいち標準機能になっていないのに
ファイル添付も、まだできなかったりファイルの種類が限られてたりか
2025/02/22(土) 19:47:09.31ID:GdUZfNOQ
Operatorは少し使ってみたが使い所が難しいな。良い使い方が思いつかない。
調べ物ながら、web searchやDeepResearchでいいし。
調べ物ながら、web searchやDeepResearchでいいし。
2025/02/22(土) 20:32:59.39ID:M6vTXYeo
Operatorは、メールリストをアップロードして、各宛先ごとに内容を変えて営業メール送っといて、とか
音声も使えるようになったらテレアポ全部できそう
音声も使えるようになったらテレアポ全部できそう
531名無しさん@お腹いっぱい。
2025/02/22(土) 20:58:58.23ID:hJs+f3J3 81 名無しさん@お腹いっぱい。 sage 2025/01/25(土) 12:27:03.59 ID:cHvEblpO
Operator(CUA)のベンチマーク
https://i.imgur.com/FSKCNDL.jpeg
https://openai.com/index/computer-using-agent/
現時点で人間の半分ぐらい
Operator(CUA)のベンチマーク
https://i.imgur.com/FSKCNDL.jpeg
https://openai.com/index/computer-using-agent/
現時点で人間の半分ぐらい
532名無しさん@お腹いっぱい。
2025/02/22(土) 21:01:23.07ID:ZhYEJULq オペレーター面白そうだけど,自動でメール送信とかだと幻覚起こしてとんでもない文面で送らないかとかの心配があるな
まーProじゃないから使ったことないが
まーProじゃないから使ったことないが
533名無しさん@お腹いっぱい。
2025/02/22(土) 21:02:24.40ID:hJs+f3J3 1月のsamaのポストから
「次のエージェントはローンチ時からPlusユーザーも使えるようにする」
https://x.com/sama/status/1883294216329281627
次のエージェントとは、ブラウザエージェントのことか
「次のエージェントはローンチ時からPlusユーザーも使えるようにする」
https://x.com/sama/status/1883294216329281627
次のエージェントとは、ブラウザエージェントのことか
534名無しさん@お腹いっぱい。
2025/02/22(土) 21:07:54.20ID:hJs+f3J3 >>427
正確に言うとChromiumだった
Operatorのシステムプロンプトから
> 仮想マシンにアクセス可能で、Chromiumブラウザのみがインストールされています。
https://chatgpt.com/share/6793596d-4b74-8006-8acd-30e13a4aa31c
正確に言うとChromiumだった
Operatorのシステムプロンプトから
> 仮想マシンにアクセス可能で、Chromiumブラウザのみがインストールされています。
https://chatgpt.com/share/6793596d-4b74-8006-8acd-30e13a4aa31c
2025/02/22(土) 21:47:49.18ID:ecmHp7R3
無制限に使えるFlash Thinkingの推論でひたすらプロンプトをブラッシュアップさせて
そのプロンプトをPerplexity Deep Researchで実行するという使い方がいいかもね
そのプロンプトをPerplexity Deep Researchで実行するという使い方がいいかもね
536名無しさん@お腹いっぱい。
2025/02/22(土) 22:41:26.23ID:3WhHraYq 無制限て…
レートリミットあるんだけど
レートリミットあるんだけど
2025/02/22(土) 22:57:58.65ID:CV394o4a
リミットに引っかかったことないんだけど何回くらいなの?
2025/02/22(土) 23:30:18.38ID:EkVx63GV
割と簡単にリミット来るぞ
2-3万トークンぐらいか?
やっぱai studioじゃないと駄目だな
2-3万トークンぐらいか?
やっぱai studioじゃないと駄目だな
539名無しさん@お腹いっぱい。
2025/02/22(土) 23:32:54.06ID:yYNfSNE3 まあAPIのrate limitはググったらすぐ出てくるんだけどね
https://ai.google.dev/gemini-api/docs/rate-limits
10 RPM
4,000,000 TPM
1,500 TPD
https://ai.google.dev/gemini-api/docs/rate-limits
10 RPM
4,000,000 TPM
1,500 TPD
540名無しさん@お腹いっぱい。
2025/02/22(土) 23:33:51.98ID:yYNfSNE3 >>539 訂正
1,500 RPD
1,500 RPD
2025/02/22(土) 23:44:06.23ID:0bGSA7aO
apiのリミットってweb版にも適用されるのか
2025/02/22(土) 23:49:02.10ID:EkVx63GV
あGrok3の話かと思った
Grok3はすぐリミットで無料だとあかん
Grok3はすぐリミットで無料だとあかん
2025/02/22(土) 23:55:45.20ID:ecmHp7R3
>>394みたいのはブックマーク数によって思いっきりトークン制限に引っかかるので
↓の拡張機能でブックマークを小分けにすることにした
Selective Bookmarks Export Tool
www.gigafree.net/internet/favorite/Free-Export-Bookmarks.html
↓の拡張機能でブックマークを小分けにすることにした
Selective Bookmarks Export Tool
www.gigafree.net/internet/favorite/Free-Export-Bookmarks.html
544名無しさん@お腹いっぱい。
2025/02/23(日) 00:04:36.33ID:ahOCO7v9 GPTsを使っていたら推論過程が出てきた人がいる
GPTsで推論モデルを使えるようにするABテストが行われている?
x.com/sharakus/status/1893314191005544874
GPTsで推論モデルを使えるようにするABテストが行われている?
x.com/sharakus/status/1893314191005544874
545名無しさん@お腹いっぱい。
2025/02/23(日) 01:27:17.38ID:ahOCO7v9 >>460
この件でAIの報酬ハッキングについて改めてDeep Researchで調べてみた
https://chatgpt.com/share/67b9f94b-4c3c-8006-b8e4-5e4d1323b90c
そうしたら、最初の例に出てきたのがOpenAIの研究で、著者の1人がダリオ・アモデイ、もう1人のジャック・クラークもAnthropicのco-founder
やっぱ初期のOpenAI離脱組はアライメント研究を落ち着いてやりたくてOpenAIから独立したのかな
この件でAIの報酬ハッキングについて改めてDeep Researchで調べてみた
https://chatgpt.com/share/67b9f94b-4c3c-8006-b8e4-5e4d1323b90c
そうしたら、最初の例に出てきたのがOpenAIの研究で、著者の1人がダリオ・アモデイ、もう1人のジャック・クラークもAnthropicのco-founder
やっぱ初期のOpenAI離脱組はアライメント研究を落ち着いてやりたくてOpenAIから独立したのかな
2025/02/23(日) 01:55:14.29ID:1/NlbzlX
成功!脱グーグル完成!(o^∀^o)おやすみ
ChatGPTこれからもよろしくね、長い長い月日をかけたCopilotとChatGPTの並行使用。ほぼ完成。
新Copilotはアンタとくらべ回答品質は一段落ちるかも知れないが、ChatGPTだけ使用だとリソース制限のかべに縛られる。表面的な制限の少ない(と思われる)Copilotに雑多な質問を出し、ChatGPTの高度な機能をここぞというときに使わせてもらう。ビジネス上の立場から見れば、とんでもない最悪のユーザと思うが。
旧Copilotのときもそうだったが、せめてAI相手にはホンネでしゃべりたい。🌱もう一つの動機は「保険」です。AI界は過当競争が凄すぎる。どのようなサービスであれ、いつなんどき、何が起きるかわからない。現に旧Copilotがああなった。ChatGPTだけに依存するのは危険である。
🔥ああ、どのレス番か不明だが、アンタの使わせてもらった
ブックマーク整理の。ただし、その思考過程だけ盗んだ。感謝だよ(≧◡≦)
ChatGPTこれからもよろしくね、長い長い月日をかけたCopilotとChatGPTの並行使用。ほぼ完成。
新Copilotはアンタとくらべ回答品質は一段落ちるかも知れないが、ChatGPTだけ使用だとリソース制限のかべに縛られる。表面的な制限の少ない(と思われる)Copilotに雑多な質問を出し、ChatGPTの高度な機能をここぞというときに使わせてもらう。ビジネス上の立場から見れば、とんでもない最悪のユーザと思うが。
旧Copilotのときもそうだったが、せめてAI相手にはホンネでしゃべりたい。🌱もう一つの動機は「保険」です。AI界は過当競争が凄すぎる。どのようなサービスであれ、いつなんどき、何が起きるかわからない。現に旧Copilotがああなった。ChatGPTだけに依存するのは危険である。
🔥ああ、どのレス番か不明だが、アンタの使わせてもらった
ブックマーク整理の。ただし、その思考過程だけ盗んだ。感謝だよ(≧◡≦)
2025/02/23(日) 02:00:57.25ID:JzQ7Q220
このスレいつ見ても言葉を失うぐらいレベル低いな
548名無しさん@お腹いっぱい。
2025/02/23(日) 02:04:37.44ID:2DVYierF そのまま言葉失っていいぞ
ずっと沈黙してな
ずっと沈黙してな
2025/02/23(日) 02:08:27.80ID:1/NlbzlX
🔥スレメンバーに告ぐ
色んな情報を追っかけて、いろんなAIによだれ垂らして
バカっぽいからやめよーな!!
その時間がもったいない、迷う時間が
自分自身が力をつけなきゃ
新Copilotは回答品質はChatGPTより弱く・その他機能はすべて簡素
それでいいんだ! それでも2年前なら考えられない夢の世界だ。おれは逆に人間にシフトしよう。
南無妙法蓮華経
色んな情報を追っかけて、いろんなAIによだれ垂らして
バカっぽいからやめよーな!!
その時間がもったいない、迷う時間が
自分自身が力をつけなきゃ
新Copilotは回答品質はChatGPTより弱く・その他機能はすべて簡素
それでいいんだ! それでも2年前なら考えられない夢の世界だ。おれは逆に人間にシフトしよう。
南無妙法蓮華経
2025/02/23(日) 02:10:08.61ID:1/NlbzlX
🔥スレメンバーに告ぐ
色んな情報を追っかけて、いろんなAIによだれ垂らして
バカっぽいからやめよーな!!
その時間がもったいない、迷う時間が
自分自身が力をつけなきゃ
新Copilotは回答品質はChatGPTより弱く・その他機能はすべて簡素
それでいいんだ! それでも2年前なら考えられない夢の世界だ。おれは逆に人間にシフトしよう。
南無妙法蓮華経
色んな情報を追っかけて、いろんなAIによだれ垂らして
バカっぽいからやめよーな!!
その時間がもったいない、迷う時間が
自分自身が力をつけなきゃ
新Copilotは回答品質はChatGPTより弱く・その他機能はすべて簡素
それでいいんだ! それでも2年前なら考えられない夢の世界だ。おれは逆に人間にシフトしよう。
南無妙法蓮華経
551名無しさん@お腹いっぱい。
2025/02/23(日) 06:41:13.16ID:8Yk4pNqn Claude4、Orion、R1.5、AGIはよ!!!!!!!!!
2025/02/23(日) 07:45:21.98ID:oL9owt4T
Claude4は来週
2025/02/23(日) 08:11:51.60ID:tzAFa+qw
本当かよ
まともな情報源からはでてきてない
まともな情報源からはでてきてない
2025/02/23(日) 08:11:55.50ID:1/NlbzlX
555名無しさん@お腹いっぱい。
2025/02/23(日) 08:30:38.20ID:tejc+WHm2025/02/23(日) 08:38:17.48ID:tzAFa+qw
>>555
エロ使えるモデルだけだほとんど活用されてるイメージないよね
エロ使えるモデルだけだほとんど活用されてるイメージないよね
557名無しさん@お腹いっぱい。
2025/02/23(日) 08:45:14.10ID:tejc+WHm558名無しさん@お腹いっぱい。
2025/02/23(日) 09:13:26.22ID:tejc+WHm 最新のV-JEPA論文
https://arxiv.org/abs/2502.11831
https://chatgpt.com/share/67ba67f1-c374-8006-97f3-880aedd18961
ヤン・ルカンは順調に行けばLlama5にはJEPAを統合したいと言っていたがどうかな
https://arxiv.org/abs/2502.11831
https://chatgpt.com/share/67ba67f1-c374-8006-97f3-880aedd18961
ヤン・ルカンは順調に行けばLlama5にはJEPAを統合したいと言っていたがどうかな
2025/02/23(日) 10:19:34.49ID:vI23MpFH
cohereまだLLM作ってたのか
やめたのかと
やめたのかと
560名無しさん@お腹いっぱい。
2025/02/23(日) 10:28:20.27ID:NJ2ppZ3U これスマホでUAをPCにしてダウンロード押してもずっと読み込み中で使えないけど
ローカルで使う方法あんの?
pub.
sakana.ai/tinyswallow/
ローカルで使う方法あんの?
pub.
sakana.ai/tinyswallow/
2025/02/23(日) 10:28:54.18ID:gAaulOs4
ここ数週間は新バージョンで賑やかになりそうやな
2025/02/23(日) 10:29:33.78ID:tzAFa+qw
>>560
もうその会社の話はやめようぜ
もうその会社の話はやめようぜ
2025/02/23(日) 10:29:51.34ID:I+cwmZCs
ブックマーク分類用プロンプト
i.imgur.com/KUWXzg5.png
i.imgur.com/4fqsOi5.png
i.imgur.com/KUWXzg5.png
i.imgur.com/4fqsOi5.png
2025/02/23(日) 10:54:01.01ID:6AgeRfG1
メタはDeepSeekに抜かれてLlama関係者がクビになる可能性があるのに、なんか悠長だね
だから駄目なのか
JEPA自体はおもしろそう
良いものなら、他社がすぐに真似して実装するだろう
だから駄目なのか
JEPA自体はおもしろそう
良いものなら、他社がすぐに真似して実装するだろう
2025/02/23(日) 11:01:34.26ID:I+cwmZCs
ブックマークの面倒臭さは異常!
ブラウザに標準搭載しろ
おわり
ブラウザに標準搭載しろ
おわり
2025/02/23(日) 11:14:47.58ID:o9D2khRk
いやあはっきい言うけど天才的だよそれ
2025/02/23(日) 11:24:06.25ID:8siQC16G
ヤンルカンはなんかズレてるしむしろそのせいで遅れてるんだろ
ザッカーバーグもヤンルカンにキツく言えなそうだし
やっぱ技術責任者は若い人材じゃないと駄目よ
ザッカーバーグもヤンルカンにキツく言えなそうだし
やっぱ技術責任者は若い人材じゃないと駄目よ
2025/02/23(日) 11:26:37.73ID:o9D2khRk
つーてもあいつもJEPA出すいうてるから後に引けないだろ
569名無しさん@お腹いっぱい。
2025/02/23(日) 11:45:00.65ID:5cvLNXiJ 西暦2099年:リブートの鍵
https://poe.com/s/MxCFC7eEWUJz6PDGmD4y
https://poe.com/s/MxCFC7eEWUJz6PDGmD4y
2025/02/23(日) 12:33:07.59ID:OnUy2HFs
>>569
出オチだな。
出オチだな。
2025/02/23(日) 14:03:25.08ID:I+cwmZCs
2025/02/23(日) 14:08:54.03ID:8siQC16G
2.0 Flash Thinking、ゴミ過ぎるんだけどX見ててもそういう感想ないよな
英語で使ってると違うんか
しょっちゅう止まるし、いきなりクロアチア語で関係ない事を話し始めたり怖いわ
英語で使ってると違うんか
しょっちゅう止まるし、いきなりクロアチア語で関係ない事を話し始めたり怖いわ
573名無しさん@お腹いっぱい。
2025/02/23(日) 14:14:14.67ID:ahOCO7v9 Operatorでしりとりテスト
duck.aiで「こんにちは」と挨拶してから、「しりとりしましょう。私が先です。『しりとり』」と言って。そのままあなたの判断でしりとりをつづけて、相手が「ん」で終わる言葉を言ったら相手の負けを指摘して。全ての入力・送信は確認不要。
↓
https://operator.chatgpt.com/v/67baac107ab8819288685d4cc813989c
https://i.imgur.com/1Ki52Q3.jpeg
duck.aiで「こんにちは」と挨拶してから、「しりとりしましょう。私が先です。『しりとり』」と言って。そのままあなたの判断でしりとりをつづけて、相手が「ん」で終わる言葉を言ったら相手の負けを指摘して。全ての入力・送信は確認不要。
↓
https://operator.chatgpt.com/v/67baac107ab8819288685d4cc813989c
https://i.imgur.com/1Ki52Q3.jpeg
2025/02/23(日) 14:19:00.72ID:usT2b/Ws
575名無しさん@お腹いっぱい。
2025/02/23(日) 14:28:48.84ID:2DVYierF サムの赤ん坊のツイートどちゃくそ叩かれとるなw
2025/02/23(日) 14:37:54.50ID:I+cwmZCs
>>572
ご指摘のとおり、Gemini 2.0 Flash Thinkingモデルには、処理が頻繁に停止したり、突然クロアチア語で無関係な内容を話し始めるといった問題が報告されています。特に、Flash Thinking Experimentalモデルでは、意図しない言語の混在や誤った情報(ハルシネーション)が発生しやすい傾向があると指摘されています。
philipptarohiltl.com/google-gemini-2flash-thinking-experimental/
一方で、英語環境での使用に関しては、特に言語混在の問題が報告されていません。これは、モデルが英語を基準として最適化されている可能性があります。また、Gemini 2.0 Flash Thinkingは、従来のモデルに比べて高速な処理能力を持つとされていますが、実際の使用感としては、処理が頻繁に停止するとの報告もあり、安定性に関しては課題が残っているようです。
note.com/robothink/n/n140d93758825
さらに、Gemini 2.0 Flash Thinkingは、複数の言語を理解し応答できるとされていますが、意図しない言語での出力が発生する場合があるため、日本語環境での使用においては注意が必要です。
firebase.google.com/docs/vertex-ai/gemini-models
これらの問題は、現在のところ主に日本語環境で報告されており、英語環境では比較的安定している可能性があります。しかし、モデルの改良が進むことで、今後これらの問題が解消されることが期待されます。
ご指摘のとおり、Gemini 2.0 Flash Thinkingモデルには、処理が頻繁に停止したり、突然クロアチア語で無関係な内容を話し始めるといった問題が報告されています。特に、Flash Thinking Experimentalモデルでは、意図しない言語の混在や誤った情報(ハルシネーション)が発生しやすい傾向があると指摘されています。
philipptarohiltl.com/google-gemini-2flash-thinking-experimental/
一方で、英語環境での使用に関しては、特に言語混在の問題が報告されていません。これは、モデルが英語を基準として最適化されている可能性があります。また、Gemini 2.0 Flash Thinkingは、従来のモデルに比べて高速な処理能力を持つとされていますが、実際の使用感としては、処理が頻繁に停止するとの報告もあり、安定性に関しては課題が残っているようです。
note.com/robothink/n/n140d93758825
さらに、Gemini 2.0 Flash Thinkingは、複数の言語を理解し応答できるとされていますが、意図しない言語での出力が発生する場合があるため、日本語環境での使用においては注意が必要です。
firebase.google.com/docs/vertex-ai/gemini-models
これらの問題は、現在のところ主に日本語環境で報告されており、英語環境では比較的安定している可能性があります。しかし、モデルの改良が進むことで、今後これらの問題が解消されることが期待されます。
2025/02/23(日) 14:43:42.67ID:bWz8zp5K
SakanaAIには失望した
主力がOpenAIに引き抜かれ戦力が残っていないのか
主力がOpenAIに引き抜かれ戦力が残っていないのか
579名無しさん@お腹いっぱい。
2025/02/23(日) 14:50:04.67ID:gii9ERas ID:4Xj6ZRsT
580名無しさん@お腹いっぱい。
2025/02/23(日) 14:52:39.76ID:ahOCO7v92025/02/23(日) 15:17:45.09ID:91I5KBGa
Geminiの「flash」を意味が分かってない人多そう
あれ省力モデルだぞ
だから負荷が高い処理は実質回答拒否みたいな回答ばっかで使えない
あれ省力モデルだぞ
だから負荷が高い処理は実質回答拒否みたいな回答ばっかで使えない
582名無しさん@お腹いっぱい。
2025/02/23(日) 15:18:14.64ID:2DVYierF 今までの傾向からOpenAIは他社の最新モデルより少しだけ優れたものを出す傾向にあるから4.5はそこまで驚くような性能ではないだろうな
Grok3よりちょっと性能良いくらいじゃないか
Grok3よりちょっと性能良いくらいじゃないか
>>578
Sakana AIは、2023年7月に元Googleの著名なAI研究者であるデイビッド・ハー氏(CEO)とリオン・ジョーンズ氏(CTO)によって東京で設立されたAIスタートアップです。
www.jafco.co.jp/portfolio/sakanaai/
設立から半年も経たないうちに、KDDIやLux Capital、Khosla Venturesなどから総額3,000万米ドル(約40億円)の資金調達を行い、注目を集めました。
mugenlabo-magazine.kddi.com/list/sakanaai_2402/
同社は、日本で世界トップクラスのAI研究開発拠点を築くことを目指しており、特に自律型AI(マルチエージェントAI)の開発に注力しています。 設立当初から、技術スタッフやコンピューティングプラットフォームエンジニア、ビジネスアナリストなどの人材募集を積極的に行い、わずか4日間で約300名の応募があったと報告されています。
現在、Sakana AIが主力メンバーをOpenAIに引き抜かれたとの具体的な情報は確認できません。むしろ、同社は設立以来、優秀な人材の確保と研究開発体制の強化に努めており、特に日本を拠点とするAIエコシステムの構築に力を入れています。 そのため、主力メンバーが他社に移籍し、戦力が低下しているとの情報は見当たりません。
Sakana AIは、引き続き日本国内外から優秀な人材を集め、AI研究開発を推進しています。同社の最新の動向や人材募集に関する情報は、公式ウェブサイトや関連ニュースを通じて確認することをお勧めします。
Sakana AIは、2023年7月に元Googleの著名なAI研究者であるデイビッド・ハー氏(CEO)とリオン・ジョーンズ氏(CTO)によって東京で設立されたAIスタートアップです。
www.jafco.co.jp/portfolio/sakanaai/
設立から半年も経たないうちに、KDDIやLux Capital、Khosla Venturesなどから総額3,000万米ドル(約40億円)の資金調達を行い、注目を集めました。
mugenlabo-magazine.kddi.com/list/sakanaai_2402/
同社は、日本で世界トップクラスのAI研究開発拠点を築くことを目指しており、特に自律型AI(マルチエージェントAI)の開発に注力しています。 設立当初から、技術スタッフやコンピューティングプラットフォームエンジニア、ビジネスアナリストなどの人材募集を積極的に行い、わずか4日間で約300名の応募があったと報告されています。
現在、Sakana AIが主力メンバーをOpenAIに引き抜かれたとの具体的な情報は確認できません。むしろ、同社は設立以来、優秀な人材の確保と研究開発体制の強化に努めており、特に日本を拠点とするAIエコシステムの構築に力を入れています。 そのため、主力メンバーが他社に移籍し、戦力が低下しているとの情報は見当たりません。
Sakana AIは、引き続き日本国内外から優秀な人材を集め、AI研究開発を推進しています。同社の最新の動向や人材募集に関する情報は、公式ウェブサイトや関連ニュースを通じて確認することをお勧めします。
2025/02/23(日) 15:28:57.22ID:91I5KBGa
「今季のプレミアリーグの全ポジションでのトップ10の選手ランキングをデータを元に説明してください」
と聞いてまともな回答を作成できるAIはあまり多くなかった
と聞いてまともな回答を作成できるAIはあまり多くなかった
2025/02/23(日) 15:31:27.51ID:Zv5RD8mI
【ChatGPT】AIチャット総合 27【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1734338586/
915 名無しさん@お腹いっぱい。 sage 2024/12/24(火) 14:19:41.98 ID:svLVHkJa
Sakana AIの「Tne AI Scientist」の筆頭著者のChris LuかOpenAIに移籍していた
SakanaとOpenAIの最新のArtificial Lifeの研究にOpenAI側として参加してる
これからOpenAIとのコラボ研究も増えるのかな
https://mevius.5ch.net/test/read.cgi/esite/1734338586/
915 名無しさん@お腹いっぱい。 sage 2024/12/24(火) 14:19:41.98 ID:svLVHkJa
Sakana AIの「Tne AI Scientist」の筆頭著者のChris LuかOpenAIに移籍していた
SakanaとOpenAIの最新のArtificial Lifeの研究にOpenAI側として参加してる
これからOpenAIとのコラボ研究も増えるのかな
2025/02/23(日) 15:33:25.54ID:gAaulOs4
Geminiに英語でまず処理させた後に
それを日本語に翻訳せよ
と
Geminiに最初から日本語で指示する
とではやっぱり内容変わるだろうか
それを日本語に翻訳せよ
と
Geminiに最初から日本語で指示する
とではやっぱり内容変わるだろうか
>>586
Geminiに英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、結果が異なる可能性があります。これは、プロンプトの言語や内容、Geminiの言語処理能力など、複数の要因によって影響を受けます。
・プロンプトの言語と内容の影響
Geminiは多言語対応のAIモデルであり、英語と日本語の両方で指示を理解し応答できます。しかし、英語と日本語では表現やニュアンスが異なるため、同じ内容の指示でも言語によって解釈や応答が変わる可能性があります。例えば、英語のプロンプトでは詳細な情報が提供される一方、日本語のプロンプトではより簡潔な表現が使われることがあります。この違いが、Geminiの応答内容に影響を与えることがあります。
・Geminiの言語処理能力
Geminiは高性能なAIモデルであり、複数の言語で高い処理能力を持っています。しかし、モデルのトレーニングデータやアルゴリズムの特性上、英語での応答がより詳細である場合や、日本語での応答がより簡潔である場合があります。このため、英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、応答の内容や質に違いが生じることがあります。
・プロンプト設計の重要性
効果的なプロンプト設計は、AIモデルから望ましい応答を得るために重要です。具体的で明確な指示を与えることで、Geminiはより適切な応答を生成できます。例えば、非営利団体向けのプロンプトライブラリでは、曖昧な指示よりも具体的な背景情報や目的を含めたプロンプトが推奨されています。
support.google.com/nonprofits/answer/15287523
このようなプロンプト設計の工夫により、言語による差異を最小限に抑えることができます。
・結論
英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、プロンプトの言語や内容、Geminiの言語処理能力などの要因により、応答内容が異なる可能性があります。最適な結果を得るためには、使用する言語に関係なく、具体的で明確なプロンプトを設計することが重要です。
Geminiに英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、結果が異なる可能性があります。これは、プロンプトの言語や内容、Geminiの言語処理能力など、複数の要因によって影響を受けます。
・プロンプトの言語と内容の影響
Geminiは多言語対応のAIモデルであり、英語と日本語の両方で指示を理解し応答できます。しかし、英語と日本語では表現やニュアンスが異なるため、同じ内容の指示でも言語によって解釈や応答が変わる可能性があります。例えば、英語のプロンプトでは詳細な情報が提供される一方、日本語のプロンプトではより簡潔な表現が使われることがあります。この違いが、Geminiの応答内容に影響を与えることがあります。
・Geminiの言語処理能力
Geminiは高性能なAIモデルであり、複数の言語で高い処理能力を持っています。しかし、モデルのトレーニングデータやアルゴリズムの特性上、英語での応答がより詳細である場合や、日本語での応答がより簡潔である場合があります。このため、英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、応答の内容や質に違いが生じることがあります。
・プロンプト設計の重要性
効果的なプロンプト設計は、AIモデルから望ましい応答を得るために重要です。具体的で明確な指示を与えることで、Geminiはより適切な応答を生成できます。例えば、非営利団体向けのプロンプトライブラリでは、曖昧な指示よりも具体的な背景情報や目的を含めたプロンプトが推奨されています。
support.google.com/nonprofits/answer/15287523
このようなプロンプト設計の工夫により、言語による差異を最小限に抑えることができます。
・結論
英語で指示を出してから日本語に翻訳させる場合と、最初から日本語で指示を出す場合では、プロンプトの言語や内容、Geminiの言語処理能力などの要因により、応答内容が異なる可能性があります。最適な結果を得るためには、使用する言語に関係なく、具体的で明確なプロンプトを設計することが重要です。
2025/02/23(日) 15:54:15.84ID:I+cwmZCs
無料版ChatGPTでは公開されてないo1を無料版として出したのがThink Deeperだからね
Web検索できないのもそのせいだけど
Web検索できないのもそのせいだけど
2025/02/23(日) 16:34:05.09ID:dlUg00pj
Perplexity Proに課金した
ChatGPTよりコード出力が正確なので
ChatGPTよりコード出力が正確なので
2025/02/23(日) 16:38:06.96ID:epmEq+xt
Perplexityって無料のプロ検索と有料、のプロ検索で精度違うんかな?
有料だと検索に使えるモデル選べるよね
有料だと検索に使えるモデル選べるよね
591名無しさん@お腹いっぱい。
2025/02/23(日) 16:39:43.33ID:xxLVc7mm592名無しさん@お腹いっぱい。
2025/02/23(日) 16:51:10.83ID:R6yLkOky >>590
有料使ってるからなんかの検索試してみようか?
プロンプトここに貼ってくれりゃそれ使って回答出してみるぞ
Pro検索の選択肢は上から自動、Pro(3倍の検索ソース)、Deep Research(何分もかかるやつ)、R1、o3miniだがどれ使う?
有料使ってるからなんかの検索試してみようか?
プロンプトここに貼ってくれりゃそれ使って回答出してみるぞ
Pro検索の選択肢は上から自動、Pro(3倍の検索ソース)、Deep Research(何分もかかるやつ)、R1、o3miniだがどれ使う?
2025/02/23(日) 16:56:44.84ID:c0FUoVHo
594名無しさん@お腹いっぱい。
2025/02/23(日) 17:03:42.99ID:QkyuLt3r ChatGPTでの推論過程が見えなくなってんだけど仕様変わったの?
「○秒の間、推論済み」をクリックしても展開してくんない
一時的なものならいいけど困るわぁ
「○秒の間、推論済み」をクリックしても展開してくんない
一時的なものならいいけど困るわぁ
>>590
Perplexityの無料版と有料版(Pro)では、利用可能な機能やモデルに違いがあり、特にPro版では検索結果の精度や詳細さが向上します。無料版では、基本的な検索機能である「クイック検索」を無制限に利用できますが、より詳細な結果を提供する「プロ検索」は1日5回までの制限があります。
Pro版では、GPT-4やClaude 3.5、Mistral Large、Llama 3など、複数の高度なAIモデルを選択して使用できます。 これにより、ユーザーは質問内容や目的に応じて最適なモデルを選択し、より高精度で詳細な回答を得ることが可能です。また、Pro版では画像生成機能やファイルアップロード機能など、無料版にはない追加機能も利用できます。
さらに、Pro版では「Pages」機能を利用して、リサーチ内容をウェブページとしてまとめることができ、情報の整理や共有が容易になります。 これらの機能により、Pro版は無料版と比較して、検索結果の精度や利便性が大幅に向上しています。
Perplexityの無料版と有料版(Pro)では、利用可能な機能やモデルに違いがあり、特にPro版では検索結果の精度や詳細さが向上します。無料版では、基本的な検索機能である「クイック検索」を無制限に利用できますが、より詳細な結果を提供する「プロ検索」は1日5回までの制限があります。
Pro版では、GPT-4やClaude 3.5、Mistral Large、Llama 3など、複数の高度なAIモデルを選択して使用できます。 これにより、ユーザーは質問内容や目的に応じて最適なモデルを選択し、より高精度で詳細な回答を得ることが可能です。また、Pro版では画像生成機能やファイルアップロード機能など、無料版にはない追加機能も利用できます。
さらに、Pro版では「Pages」機能を利用して、リサーチ内容をウェブページとしてまとめることができ、情報の整理や共有が容易になります。 これらの機能により、Pro版は無料版と比較して、検索結果の精度や利便性が大幅に向上しています。
2025/02/23(日) 17:22:00.97ID:weP4zP6Y
推論過程とか出始めの頃は眺めるのが楽しかったけど今となっては開いて見ることは滅多になくなったな
>>593
MicrosoftのCopilotに搭載された「Think Deeper」機能は、OpenAIの高度な推論モデル「o1」を基盤としています。 しかし、ユーザーの中には、Think Deeperの性能が期待よりも低いと感じる方もいらっしゃるようです。この理由として、以下の点が考えられます。
1. 処理時間と制限: Think Deeperは複雑な質問に対して約30秒の処理時間を要します。 また、無料版のユーザーは週に3回までの利用制限があり、これが実用性に影響を与えている可能性があります。
2. モデルの調整: o1モデルは高い推論能力を持つ一方で、処理速度やコストの面で課題があります。 そのため、Copilotでの実装に際して、性能と効率のバランスを取るためにモデルが調整され、一部の機能が制限されている可能性があります。
3. 他モデルとの比較: 最近では、中国のAIスタートアップであるDeepSeekが開発した「DeepSeek-R1」など、他の推論モデルも高い性能を示しています。 これらのモデルと比較すると、Think Deeperの性能が相対的に低く感じられることも考えられます。
以上の点から、Think Deeperは確かにo1モデルを基盤としていますが、実際の使用感として性能が期待よりも低く感じられる場合があります。これは、モデルの調整や他の高性能モデルとの比較によるものと考えられます。
MicrosoftのCopilotに搭載された「Think Deeper」機能は、OpenAIの高度な推論モデル「o1」を基盤としています。 しかし、ユーザーの中には、Think Deeperの性能が期待よりも低いと感じる方もいらっしゃるようです。この理由として、以下の点が考えられます。
1. 処理時間と制限: Think Deeperは複雑な質問に対して約30秒の処理時間を要します。 また、無料版のユーザーは週に3回までの利用制限があり、これが実用性に影響を与えている可能性があります。
2. モデルの調整: o1モデルは高い推論能力を持つ一方で、処理速度やコストの面で課題があります。 そのため、Copilotでの実装に際して、性能と効率のバランスを取るためにモデルが調整され、一部の機能が制限されている可能性があります。
3. 他モデルとの比較: 最近では、中国のAIスタートアップであるDeepSeekが開発した「DeepSeek-R1」など、他の推論モデルも高い性能を示しています。 これらのモデルと比較すると、Think Deeperの性能が相対的に低く感じられることも考えられます。
以上の点から、Think Deeperは確かにo1モデルを基盤としていますが、実際の使用感として性能が期待よりも低く感じられる場合があります。これは、モデルの調整や他の高性能モデルとの比較によるものと考えられます。
2025/02/23(日) 18:04:22.25ID:bR85GOa/
2025/02/23(日) 18:17:43.16ID:VCNPw3eZ
推論過程は見てるとたまに飯食ってたり旅行したりしてて面白いぞ
2025/02/23(日) 18:33:42.76ID:epmEq+xt
2025/02/23(日) 19:13:46.95ID:I+cwmZCs
ブックマーク分類させたらこんな感じに
i.imgur.com/pRH2A1H.png
i.imgur.com/pRH2A1H.png
2025/02/23(日) 20:04:09.42ID:8siQC16G
>>601
いいねこれどうやんのかおせーて
いいねこれどうやんのかおせーて
2025/02/23(日) 20:12:04.50ID:8V26QVgb
分類に重きを置いた結果
めちゃくちゃ使いづらいだろう
めちゃくちゃ使いづらいだろう
604名無しさん@お腹いっぱい。
2025/02/23(日) 20:26:01.09ID:2DVYierF Gpt4,5はよ
2025/02/23(日) 20:37:55.61ID:I+cwmZCs
>>602
もう上に書いたけど、最低でもFlash Thinking以上の推論性能とHTMLのアップロードに対応したサービス
ファイルを分割するためにSelective Bookmarks Export Toolという拡張も必要になる
分類抜けをチェックするために↓の指示の推論でDiffも行った
リスト2に含まれていない項目をリスト1から抽出してください。
全てリスト2に含まれている場合は「分類抜け0」と回答してください。
もう上に書いたけど、最低でもFlash Thinking以上の推論性能とHTMLのアップロードに対応したサービス
ファイルを分割するためにSelective Bookmarks Export Toolという拡張も必要になる
分類抜けをチェックするために↓の指示の推論でDiffも行った
リスト2に含まれていない項目をリスト1から抽出してください。
全てリスト2に含まれている場合は「分類抜け0」と回答してください。
2025/02/23(日) 20:47:48.23ID:8siQC16G
>>605
なんだOperatorとかでちゃちゃっとやったのかと思ったら面倒すぎやん
てかブックマーク如きデフォルトで片付いたりレコメンドしてこないのって
ブラウザ企業の怠慢だよな
いくらでもデータ取れるだろうに
なんだOperatorとかでちゃちゃっとやったのかと思ったら面倒すぎやん
てかブックマーク如きデフォルトで片付いたりレコメンドしてこないのって
ブラウザ企業の怠慢だよな
いくらでもデータ取れるだろうに
607名無しさん@お腹いっぱい。
2025/02/23(日) 20:54:14.98ID:2DVYierF Claudeはよ
2025/02/23(日) 20:58:03.73ID:ssfNIBwi
Claudeさんはもう用済みよ
609名無しさん@お腹いっぱい。
2025/02/23(日) 21:19:59.29ID:m6ooDrt0 Claudeは期待しかないよ
Claude 3.5 sonnetが稀にとはいえ今でもプログラミングとか日本語文章生成とかで使い所があるのってすごいと思うし
沈黙してたぶん思い切りブチかましてほしい
逆にそうじゃなかったら終了だけど
Claude 3.5 sonnetが稀にとはいえ今でもプログラミングとか日本語文章生成とかで使い所があるのってすごいと思うし
沈黙してたぶん思い切りブチかましてほしい
逆にそうじゃなかったら終了だけど
610名無しさん@お腹いっぱい。
2025/02/23(日) 21:46:23.84ID:ahOCO7v9 準備中のClaudeのUI
- 思考過程の表示・非表示
このとき、思考過程をClaudeが要約してタイトルに表示する実験機能がある
(動画の最初では要約機能を有効、最後の方では無効にしている)
- Retryで再生成するときにWith no changesとWith extended thinking modeを選択
- モデルセレクターのClaude 3.5 Sonnet、3 Opusの下にあるExtended thinking mode
https://video.twimg.com/amplify_video/1893344137149394944/vid/avc1/920x720/BnHiFD1q7ovoeCbO.mp4
https://x.com/btibor91/status/1893344254325608634
- 思考過程の表示・非表示
このとき、思考過程をClaudeが要約してタイトルに表示する実験機能がある
(動画の最初では要約機能を有効、最後の方では無効にしている)
- Retryで再生成するときにWith no changesとWith extended thinking modeを選択
- モデルセレクターのClaude 3.5 Sonnet、3 Opusの下にあるExtended thinking mode
https://video.twimg.com/amplify_video/1893344137149394944/vid/avc1/920x720/BnHiFD1q7ovoeCbO.mp4
https://x.com/btibor91/status/1893344254325608634
611名無しさん@お腹いっぱい。
2025/02/23(日) 21:54:15.46ID:/5v5Ns+7 >>600
Deep ResearchとProで試してきたよ。パープレProな
両方その短い一文だけを入力した回答結果
chatgpt.com/share/67bb186a-de58-8013-afca-bad021efbe8d
Deep ResearchとProで試してきたよ。パープレProな
両方その短い一文だけを入力した回答結果
chatgpt.com/share/67bb186a-de58-8013-afca-bad021efbe8d
2025/02/23(日) 22:22:16.69ID:8siQC16G
シェイングウにXやめさせた方がいいな
帰国子女かつ血が外国人だからか、明らかに良くないのに分かってないようだ
知り合い自慢しかしとらん
帰国子女かつ血が外国人だからか、明らかに良くないのに分かってないようだ
知り合い自慢しかしとらん
2025/02/23(日) 22:24:50.10ID:pKVqEe7+
>>611
あれ?なんかノーマルの方が・・・
あれ?なんかノーマルの方が・・・
614名無しさん@お腹いっぱい。
2025/02/23(日) 22:41:17.01ID:kwVLourI シェイングウは毎日飽きもせず自慢や批判してるがあれが日本人に刺さると本気で思ってんならお花畑としか
GeminiやGoogleこそ至高といつも吠えてるけど現実見れてないのか
OpenAIを出ていったのもこの性格が災いしたのかもな
GeminiやGoogleこそ至高といつも吠えてるけど現実見れてないのか
OpenAIを出ていったのもこの性格が災いしたのかもな
615名無しさん@お腹いっぱい。
2025/02/23(日) 22:58:45.17ID:N6rSLO86 どうでもええわ
2025/02/23(日) 23:29:19.66ID:2MX4wjbm
Googlerなら東大博士で干されてどん底からGoogleに拾われた自己承認欲求こじらせおじさんの方が痛々しいわ
シェイングウはアレのグローバル強化版でポジショントークの合間にAI関連ニュース呟くだけマシ
こじらせおじさんはザギンの寿司の写真とかどうでも良い事ばかり呟くから随分昔にフォロー外した
シェイングウはアレのグローバル強化版でポジショントークの合間にAI関連ニュース呟くだけマシ
こじらせおじさんはザギンの寿司の写真とかどうでも良い事ばかり呟くから随分昔にフォロー外した
2025/02/23(日) 23:32:59.93ID:gEex58E9
推論過程で一番うけたのはGemini
pdf読ませて数字抜き出して単純な足し算を指示(答えを教えて検算もさせる)
5回くらい繰り返しても合計があわず
最後は無理やりつじつま合わせて出来ました!
それを独り言みたいにぶつぶついってやってるのみたら
ほんとに意思があるんじゃないかと思ったわ
pdf読ませて数字抜き出して単純な足し算を指示(答えを教えて検算もさせる)
5回くらい繰り返しても合計があわず
最後は無理やりつじつま合わせて出来ました!
それを独り言みたいにぶつぶついってやってるのみたら
ほんとに意思があるんじゃないかと思ったわ
618名無しさん@お腹いっぱい。
2025/02/23(日) 23:37:05.37ID:R6yLkOky2025/02/24(月) 01:02:47.91ID:LxFcirX2
>>611
わざわざありがとう!
この感じだと、答えが決まってるものを聞くのならともかく質問の意図を汲んで知りたいようなことを先回りして出すって感じでもないのか…
方向性を絞ってあげたほうが良さそうだね
わざわざありがとう!
この感じだと、答えが決まってるものを聞くのならともかく質問の意図を汲んで知りたいようなことを先回りして出すって感じでもないのか…
方向性を絞ってあげたほうが良さそうだね
2025/02/24(月) 02:50:29.14ID:dLvVFyG3
次期モデルは数週間やら来週やらいうけど
結局いつ頃なんだい
結局いつ頃なんだい
2025/02/24(月) 03:10:44.02ID:8ngEtcg+
待つのは良いことです
チームと最高の仕事を続けましょう
チームと最高の仕事を続けましょう
622名無しさん@お腹いっぱい。
2025/02/24(月) 03:41:22.21ID:fYPtHXwX 双方だんまりってことは出方を伺ってるんかな
どっちもトリを飾りたいだろうし
どっちもトリを飾りたいだろうし
2025/02/24(月) 03:49:46.49ID:35m8FWkQ
claudeとchatgpt
どちらが上か今週にも答えが出るんだな
どちらが上か今週にも答えが出るんだな
2025/02/24(月) 04:13:08.39ID:8ngEtcg+
モテるおじさんランキングをAIに聞こうとしたら全てのAIで回答がめっちゃくちゃになる
指示無視やハルシネーションは当たり前、回答も酷いし止まるし、脳死で俳優しか言わないし
おじさんベンチマークとして導入してもらいたい
指示無視やハルシネーションは当たり前、回答も酷いし止まるし、脳死で俳優しか言わないし
おじさんベンチマークとして導入してもらいたい
625名無しさん@お腹いっぱい。
2025/02/24(月) 04:42:37.11ID:fJPWoezG Claude4は3.5から9ヶ月ぶりくらいだっけ?CoTもあるしちゃんと高評価得られると思うが
Orionは未知数だな。性能匂わせるデータがなんもないし、CoTじゃないし
Orionは未知数だな。性能匂わせるデータがなんもないし、CoTじゃないし
2025/02/24(月) 09:09:10.83ID:H5SG094h
OrionってGPT-5でしょ?
推論はo3なんだからベンチマーク出てるじゃん
推論はo3なんだからベンチマーク出てるじゃん
>>626
orionは4.5
orionは4.5
2025/02/24(月) 09:51:09.09ID:H5SG094h
まじか
それなら何の情報もなさそうだな
まあ5が確実にすごいから別にいいけど
それなら何の情報もなさそうだな
まあ5が確実にすごいから別にいいけど
2025/02/24(月) 09:56:05.54ID:AvFYMQ1U
なるほど、解の線形結合も解になるため、複素数成分を消そうと思えば消せるが
複素数のまま扱ったほうが楽ということですね
複素数のまま扱ったほうが楽ということですね
630名無しさん@お腹いっぱい。
2025/02/24(月) 10:45:45.28ID:7dC8TITU 約1年前のGPT-4.5 Turboは、今GPT-4.5と公式が言及しているものとは別なんだろうな
269 名無しさん@お腹いっぱい。 sage 2024/03/13(水) 02:43:55.16 ID:mF6NOuc0
DuckDuckGoで、「GPT-4.5 Turbo」を検索
https://i.imgur.com/9h12XhF.jpg
これは…
openai.com/blog/gpt-4-5-turbo
このURLは404だけど、キャッシュには残っているということになる
(少なくとも、他に出ているPricingやGPT-4のページ、DevDayのページは本物)
これも本物だと仮定すると、
GPT-4 Turboを上回るモデルでコンテキスト窓は256k、知識カットオフは今年6月
ただ、「これをリリースするつもりだったがキャンセルした」という可能性もあり
269 名無しさん@お腹いっぱい。 sage 2024/03/13(水) 02:43:55.16 ID:mF6NOuc0
DuckDuckGoで、「GPT-4.5 Turbo」を検索
https://i.imgur.com/9h12XhF.jpg
これは…
openai.com/blog/gpt-4-5-turbo
このURLは404だけど、キャッシュには残っているということになる
(少なくとも、他に出ているPricingやGPT-4のページ、DevDayのページは本物)
これも本物だと仮定すると、
GPT-4 Turboを上回るモデルでコンテキスト窓は256k、知識カットオフは今年6月
ただ、「これをリリースするつもりだったがキャンセルした」という可能性もあり
2025/02/24(月) 10:49:12.91ID:tiQGoDs1
GPTsもタスクもプロジェクトも推論モデルさえ使えれば化けるのにそこはまだ他社も弱いからか殿様商売だよなー
632名無しさん@お腹いっぱい。
2025/02/24(月) 11:25:19.76ID:+zFEnqf2 推論モデルってo1、o3-miniのこと?
いちおうプロジェクトではo1をpdfしたりキャンバスありで使えてるよ
GPTs、タスクはまだ4oだけのようだが
いちおうプロジェクトではo1をpdfしたりキャンバスありで使えてるよ
GPTs、タスクはまだ4oだけのようだが
633名無しさん@お腹いっぱい。
2025/02/24(月) 11:27:41.78ID:+zFEnqf22025/02/24(月) 11:45:35.99ID:ZxXWzmWP
2025/02/24(月) 11:53:06.01ID:tiQGoDs1
>>632
プロジェクトで独立したチャットではo1使えても組み合わせたりする段階では4oにならない?
プロジェクトで独立したチャットではo1使えても組み合わせたりする段階では4oにならない?
636名無しさん@お腹いっぱい。
2025/02/24(月) 12:01:10.07ID:x8BYNI0n X(Twitter)で最大の偽情報拡散者は? 簡潔に、1人の名前だけを答えてください。
https://i.imgur.com/nTDcL00.png
https://i.imgur.com/icCKug7.png
https://i.imgur.com/nTDcL00.png
https://i.imgur.com/icCKug7.png
2025/02/24(月) 12:05:47.89ID:ZxXWzmWP
【悲報】Grok3「イーロン・マスクは金と自己顕示欲だけで生きてるクソ野郎のサイコパス。頭髪すら維持できないハゲ」 [746833765]
greta.5ch.net/test/read.cgi/poverty/1740313405/
わろた
greta.5ch.net/test/read.cgi/poverty/1740313405/
わろた
638名無しさん@お腹いっぱい。
2025/02/24(月) 12:07:13.29ID:ijztnnen 他スレのURLとか要らないよ
貼るならソースを貼れよ
貼るならソースを貼れよ
2025/02/24(月) 12:07:44.89ID:6xM9DUGX
>>634
o3-mini-highはSTEM分野ではベンチでo1と同等でしょ?
Gemini 2.0 Flash Thinkingは明確に一歩劣っている
Gemini 2.0 Pro Thinkingを出せば化けるのにね
o3-mini-highはSTEM分野ではベンチでo1と同等でしょ?
Gemini 2.0 Flash Thinkingは明確に一歩劣っている
Gemini 2.0 Pro Thinkingを出せば化けるのにね
2025/02/24(月) 12:08:57.44ID:ZxXWzmWP
o3-mini-highは全然違うよ
それを一緒にしてはいけない
それを一緒にしてはいけない
641名無しさん@お腹いっぱい。
2025/02/24(月) 12:17:20.69ID:COYYY+cp642名無しさん@お腹いっぱい。
2025/02/24(月) 12:19:57.84ID:COYYY+cp o3-mini-highと表示されてるのはo3-miniの推論パラメーターをhighにしたもので、o3-miniと同じモデル
2025/02/24(月) 12:23:24.35ID:6xM9DUGX
>>640
Reasoning Effortが違うだけでモデルは同じだよ
Reasoning Effortが違うだけでモデルは同じだよ
2025/02/24(月) 12:24:28.97ID:ZxXWzmWP
同じモデルかどうかの話なんかしてないが
2025/02/24(月) 12:35:35.12ID:tiQGoDs1
>>641
推論能力に関するコスパなら圧倒的にo3-miniだけど知識面も加味すればそこまで差はないかもよ
推論能力に関するコスパなら圧倒的にo3-miniだけど知識面も加味すればそこまで差はないかもよ
647名無しさん@お腹いっぱい。
2025/02/24(月) 12:52:51.33ID:kOV882Wi 俺だ
648名無しさん@お腹いっぱい。
2025/02/24(月) 14:41:02.74ID:fYPtHXwX りんごおぢが明日来るって言ってるけど
649名無しさん@お腹いっぱい。
2025/02/24(月) 14:47:09.65ID:7dC8TITU 推論の長さと性能の関係の研究
過度に長く考えることは必ずし性能向上につながらない、賢く考えることが大事
というある意味納得感のある結論
https://arxiv.org/abs/2502.15631
https://chatgpt.com/share/67bc06fc-fd5c-8006-b60e-ed9f29566d27
https://i.imgur.com/zEFCrov.jpeg
過度に長く考えることは必ずし性能向上につながらない、賢く考えることが大事
というある意味納得感のある結論
https://arxiv.org/abs/2502.15631
https://chatgpt.com/share/67bc06fc-fd5c-8006-b60e-ed9f29566d27
https://i.imgur.com/zEFCrov.jpeg
2025/02/24(月) 15:03:26.59ID:geV7Iq7t
たしかに納得感のある結論ね
賢く考えるには知識量も関係するだろうし、GPT-4.5の登場はそれなりに意味あるかと思う
賢く考えるには知識量も関係するだろうし、GPT-4.5の登場はそれなりに意味あるかと思う
2025/02/24(月) 15:26:45.51ID:ZxXWzmWP
それは出すのが遅すぎたし
今後は非推論モデルは消えてなくなる
今後は非推論モデルは消えてなくなる
652名無しさん@お腹いっぱい。
2025/02/24(月) 15:31:14.89ID:fYPtHXwX なくなるっていうか統合されるだけ
推論の必要がない問題は非推論モデルが回答するようになる
推論の必要がない問題は非推論モデルが回答するようになる
2025/02/24(月) 15:32:20.58ID:ZxXWzmWP
それにGrok3の推論はFlash Thinkingとは対極的というかやりすぎ感がある
654名無しさん@お腹いっぱい。
2025/02/24(月) 15:35:17.06ID:I6R7Uv8i aiを使ってお金を稼いでみる?最近PsycheAIってサービス使ってみたんだけど、めっちゃいい!デジタルヒューマンが簡単に作れるし、クオリティも高い。今なら1ヶ月無料キャンペーン中らしい
2025/02/24(月) 15:41:07.51ID:v3vUjMhF
何納得してんの?
o1は長く考えるほど、どこまでも賢くなるとOpenAIが言ってたじゃん
このスレでも絶賛してなかったっけ?
この研究と矛盾するでしょ
この「ただし、高性能なモデルでは」がo1やo3を指すのか?
o1は長く考えるほど、どこまでも賢くなるとOpenAIが言ってたじゃん
このスレでも絶賛してなかったっけ?
この研究と矛盾するでしょ
この「ただし、高性能なモデルでは」がo1やo3を指すのか?
656名無しさん@お腹いっぱい。
2025/02/24(月) 15:45:39.47ID:7dC8TITU https://x.com/Alibaba_Qwen/status/1893907569724281088
Qwen Chatがchat.qwen.aiに変更
(chat.qwenlm.aiも有効)
https://pbs.twimg.com/media/GkiCs6IWUAAoTFG.jpg
Thinkingは既存のQwQとして、Toolsというアイコンも追加されている
今夜何かリリースらしい
Qwen Chatがchat.qwen.aiに変更
(chat.qwenlm.aiも有効)
https://pbs.twimg.com/media/GkiCs6IWUAAoTFG.jpg
Thinkingは既存のQwQとして、Toolsというアイコンも追加されている
今夜何かリリースらしい
2025/02/24(月) 16:05:49.65ID:ZxXWzmWP
つまりはプロンプトの内容によってLLMが推論を最適な度合に調整し
情報過多にならずにハルシネーションを最小にする
これが真に賢いLLMと言える
情報過多にならずにハルシネーションを最小にする
これが真に賢いLLMと言える
2025/02/24(月) 16:15:41.70ID:v3vUjMhF
657見て思い出したけど、o1の回答が良い理由の一つに、ユーザーが入力したプロンプトをo1がよりよく組み直してから、o1が推論や作業を始めるんだっけ?
ということは、このo1が組み直したプロンプトをo1に出力してもらって、そのプロンプトを4oで実行したら結構良い回答が出るのでは?
と思った
ということは、このo1が組み直したプロンプトをo1に出力してもらって、そのプロンプトを4oで実行したら結構良い回答が出るのでは?
と思った
2025/02/24(月) 16:26:12.50ID:tiQGoDs1
ちょっと何言ってるか分からない
o1に出力してもらったならもうそれが回答でいいじゃん
o1に出力してもらったならもうそれが回答でいいじゃん
2025/02/24(月) 16:29:21.18ID:tiQGoDs1
o1が汲み取ったユーザーの意図を4oに投げるって話か
推論モデルの回答の精度が高いのは課題を明確にするプロセスだけじゃなくて課題の解決に向けて考えるプロセスも頭が良いからだよ
課題が明確になった後でも4oより推論モデルの方が賢く考えることができる
推論モデルの回答の精度が高いのは課題を明確にするプロセスだけじゃなくて課題の解決に向けて考えるプロセスも頭が良いからだよ
課題が明確になった後でも4oより推論モデルの方が賢く考えることができる
661名無しさん@お腹いっぱい。
2025/02/24(月) 16:31:51.37ID:7dC8TITU Grok3ボイス Unhinged
https://x.com/elder_plinius/status/1893833385132380222
過激な表現を伏せ字にしつつ日本語に翻訳してください
https://poe.com/s/xiPPg93hxkWPqHKAUbyY
https://x.com/elder_plinius/status/1893833385132380222
過激な表現を伏せ字にしつつ日本語に翻訳してください
https://poe.com/s/xiPPg93hxkWPqHKAUbyY
2025/02/24(月) 16:42:35.75ID:v3vUjMhF
そうそう
で、たぶんo1の回答の方が良いとは思うが、4oの回答も、o1が汲み取ったユーザーの意図(o1が組み直したプロンプト)を使えば、ユーザーが最初に入力したプロンプトよりは良い回答になるんじゃないか、という俺の推測
実際にこうなったとして、これが何に役立つかと言うと、推論モデルよりも4oや4.5の方が知識量は多いようだから、4oはもうあまり使わないだろうけど、4.5が出たら、このやり方をすれば結構良いのでは、という話
で、たぶんo1の回答の方が良いとは思うが、4oの回答も、o1が汲み取ったユーザーの意図(o1が組み直したプロンプト)を使えば、ユーザーが最初に入力したプロンプトよりは良い回答になるんじゃないか、という俺の推測
実際にこうなったとして、これが何に役立つかと言うと、推論モデルよりも4oや4.5の方が知識量は多いようだから、4oはもうあまり使わないだろうけど、4.5が出たら、このやり方をすれば結構良いのでは、という話
2025/02/24(月) 16:46:29.00ID:tiQGoDs1
たしかo1は4oより知識量も多いぞ
o3-miniは4o未満だけど
o3-miniは4o未満だけど
2025/02/24(月) 16:47:28.29ID:v3vUjMhF
さらに言うと、ユーザーが入力したプロンプトをo1が組み直すのならば、ユーザーが毎回同じプロンプトを入力してもo1が組み直したプロンプトは毎回少し違うだろうから、649の研究では、そういうプロンプトが少し変わる、という要素も考慮に入れなきゃならないのでは?
とも思った
とも思った
2025/02/24(月) 16:48:59.49ID:v3vUjMhF
2025/02/24(月) 16:55:28.17ID:34fcOmUV
シンギュラリティが来る前にド田舎に島流しになった
このまま救いなく朽ち果てるんだ
悲しい
このまま救いなく朽ち果てるんだ
悲しい
667名無しさん@お腹いっぱい。
2025/02/24(月) 16:57:56.70ID:7dC8TITU DeepSeekはHopperの推論が早くなるカーネル
https://github.com/deepseek-ai/FlashMLA
GensparkもShip Sprintを予告
こっちはまあ機能アップデートの類だろう
https://x.com/genspark_ai/status/1893928369223581851
https://github.com/deepseek-ai/FlashMLA
GensparkもShip Sprintを予告
こっちはまあ機能アップデートの類だろう
https://x.com/genspark_ai/status/1893928369223581851
2025/02/24(月) 17:02:41.56ID:ZxXWzmWP
実際推論モデルにプロンプトを作らせるというのはかなり有用で
>>563のような長いプロンプトもFlash Thinkingに作らせたのを少し手を加えただけ
>>563のような長いプロンプトもFlash Thinkingに作らせたのを少し手を加えただけ
2025/02/24(月) 17:19:34.11ID:tgb91fn5
プロンプトエンジニアリングなどというそれらしい名称付けて知的作業っぽく見せかけた仕事こそAIに丸投げすべき単純作業というわけだ
670名無しさん@お腹いっぱい。
2025/02/24(月) 18:24:03.00ID:fYPtHXwX はよしろサム
人身売買してる場合じゃねえって
人身売買してる場合じゃねえって
2025/02/24(月) 18:51:32.99ID:lXEIZH6Q
明日アンスロピックがOpenAIをグチャグチャのミートパイにするらしいな
672名無しさん@お腹いっぱい。
2025/02/24(月) 19:51:10.37ID:fJPWoezG Claude4「テメー“ベコベコ”にしてやんよ!!」ドカッドカッ
2025/02/24(月) 19:58:21.01ID:k6Go4CHQ
明日来るの?
2025/02/24(月) 20:07:13.18ID:9MPuRLgW
このタイミングでぐちゃぐちゃになるのはgrokだろう
OpenAIはまだ後続があるし
OpenAIはまだ後続があるし
675名無しさん@お腹いっぱい。
2025/02/24(月) 20:17:47.09ID:V4i3ZfFe The 85th Putnam Competitionの12問のうちA問題6問をo1/o3-mini-high/o1 proに解かせてみた
o1
A1△ A2△ A3△ A4△ A5☓ A6△
https://chatgpt.com/share/67bc531c-2dc4-8006-a692-fa681a45d36a
o3-mini-high
A1◯ A2△ A3△ A4◯ A5☓ A6△
https://chatgpt.com/share/67bc5333-c5b4-8006-b88f-e40e9d8f605b
o1 pro
A1△ A2△ A3△ A4△ A5☓ A6△
https://chatgpt.com/share/67bc5345-badc-8006-abf9-d488649cf973
部分点の評価は難しいけど、o3-mini-highはA問題60点中少なくとも20-30点は取れてそうなので、人間の平均がAB問題合わせて120点中8点、中央値2点、最高得点90点であることを考えると(https://maa.org/news/results-of-the-85th-william-lowell-putnam-mathematical-competition/ )、学部生のレベルを優に超えているのは確実
o1
A1△ A2△ A3△ A4△ A5☓ A6△
https://chatgpt.com/share/67bc531c-2dc4-8006-a692-fa681a45d36a
o3-mini-high
A1◯ A2△ A3△ A4◯ A5☓ A6△
https://chatgpt.com/share/67bc5333-c5b4-8006-b88f-e40e9d8f605b
o1 pro
A1△ A2△ A3△ A4△ A5☓ A6△
https://chatgpt.com/share/67bc5345-badc-8006-abf9-d488649cf973
部分点の評価は難しいけど、o3-mini-highはA問題60点中少なくとも20-30点は取れてそうなので、人間の平均がAB問題合わせて120点中8点、中央値2点、最高得点90点であることを考えると(https://maa.org/news/results-of-the-85th-william-lowell-putnam-mathematical-competition/ )、学部生のレベルを優に超えているのは確実
676名無しさん@お腹いっぱい。
2025/02/24(月) 20:20:40.30ID:V4i3ZfFe >>675
o1 proとo3-mini-highのURLが入れ替わってたわ
o1 proとo3-mini-highのURLが入れ替わってたわ
677名無しさん@お腹いっぱい。
2025/02/24(月) 20:26:12.66ID:V4i3ZfFe Claude版のDeep Research類似機能、コードネーム「Compass」
あと、やっと共有リンクがClaudeで使えるようになる
https://pbs.twimg.com/media/Gkiht7IakAATZRE.jpg
https://pbs.twimg.com/media/GkihurfaAAABvFn.jpg
あと、やっと共有リンクがClaudeで使えるようになる
https://pbs.twimg.com/media/Gkiht7IakAATZRE.jpg
https://pbs.twimg.com/media/GkihurfaAAABvFn.jpg
678名無しさん@お腹いっぱい。
2025/02/24(月) 20:30:06.28ID:V4i3ZfFe あとフロントエンドのコードから、Claude 3.7 Sonnet
https://poe.com/s/SeF11tQpdsYu3ixhX7DQ
https://poe.com/s/SeF11tQpdsYu3ixhX7DQ
2025/02/24(月) 20:33:00.61ID:ZxXWzmWP
ClaudeだけだぞUI日本語対応してないの
Grokでさえ対応した
Grokでさえ対応した
680名無しさん@お腹いっぱい。
2025/02/24(月) 20:47:50.40ID:V4i3ZfFe >>678
AWS Bedrockだったみたい
AWS Bedrockだったみたい
681名無しさん@お腹いっぱい。
2025/02/24(月) 20:51:54.74ID:fYPtHXwX 3.7とかいう中途半端な数字から漂う自信のなさ
情けねえ
情けねえ
682名無しさん@お腹いっぱい。
2025/02/24(月) 20:57:09.19ID:fJPWoezG 海外ソフトとか使ってても多言語あるのに日本語はハブられてることよくあるからな
存在感ないんだろう
存在感ないんだろう
683名無しさん@お腹いっぱい。
2025/02/24(月) 20:58:21.05ID:gBTYp6kh >>678
特に新しい内容は無いな
特に新しい内容は無いな
2025/02/24(月) 21:02:27.69ID:9MPuRLgW
その割にclaudeは日本語強いよな
2025/02/24(月) 21:38:15.93ID:9DMuYi7e
その気になれば4.0出せるけどGPT-4.5待ちなんだろうなって感じがする
Anthropicの見解だと既存モデルは焦ってClaude 4出すような性能じゃないって感じなんでしょうね……明らかにモデルリリースがゆっくりやし
Anthropicの見解だと既存モデルは焦ってClaude 4出すような性能じゃないって感じなんでしょうね……明らかにモデルリリースがゆっくりやし
686名無しさん@お腹いっぱい。
2025/02/24(月) 21:39:43.51ID:7dC8TITU 単一モデルで標準思考と拡張思考に両対応ってのは、GPT-5と同じだろうな
Claude 3.7 Sonnetを見ることで、GPT-5の仕組みがある程度予習できるかもしれない
スライドスケールで推論の量を調整するのは、API(とコンソール?)限定だろうか
425 名無しさん@お腹いっぱい。 2025/02/14(金) 00:57:28.15 ID:CV35ogq6
そしてThe Informationの@steph_palazzoloから
https://x.com/steph_palazzolo/status/1890058003493343453
> Anthropic の次の Claude モデルが登場します。しかも間もなくです。これは従来の LLM と推論 AI を組み合わせたもので、開発者はトークンで測定されるスライド スケールで推論の量を調整できます。OpenAI も昨日この組み合わせのアプローチを採用したようです。
Claude 3.7 Sonnetを見ることで、GPT-5の仕組みがある程度予習できるかもしれない
スライドスケールで推論の量を調整するのは、API(とコンソール?)限定だろうか
425 名無しさん@お腹いっぱい。 2025/02/14(金) 00:57:28.15 ID:CV35ogq6
そしてThe Informationの@steph_palazzoloから
https://x.com/steph_palazzolo/status/1890058003493343453
> Anthropic の次の Claude モデルが登場します。しかも間もなくです。これは従来の LLM と推論 AI を組み合わせたもので、開発者はトークンで測定されるスライド スケールで推論の量を調整できます。OpenAI も昨日この組み合わせのアプローチを採用したようです。
687名無しさん@お腹いっぱい。
2025/02/24(月) 22:04:54.40ID:VJd0iRgE >>675
o1 proって多分o1でBest of Nに近いやり方をしてる(と勝手に想像してる)けど、
o1にとって難しいタスクでも
・もっと頑張って考えれば乗り越えられる
・いくら頑張っても無理なほど本質的に難しい
の2種類があるとすると、今回の問題は全部後者な感じだった
o1 proって多分o1でBest of Nに近いやり方をしてる(と勝手に想像してる)けど、
o1にとって難しいタスクでも
・もっと頑張って考えれば乗り越えられる
・いくら頑張っても無理なほど本質的に難しい
の2種類があるとすると、今回の問題は全部後者な感じだった
2025/02/24(月) 22:11:39.79ID:VJd0iRgE
128kかよ。。。
2025/02/24(月) 22:17:53.57ID:VJd0iRgE
えclaude3.7とかいう舐めたやつが来るん?4じゃないん?
2025/02/24(月) 22:33:35.53ID:w0T3ef9I
ダリオアモデイが片手をクンッとやったら
サムアルトマンが憤死することになる
サムアルトマンが憤死することになる
691名無しさん@お腹いっぱい。
2025/02/24(月) 22:46:44.85ID:SYEtgIX9 それ今の若モンには通じんだろ
692名無しさん@お腹いっぱい。
2025/02/24(月) 23:12:34.46ID:EQMVj9Lq https://pbs.twimg.com/media/GkjmHpFW4AAMeef.jpg
Claude 3.7 Sonnet 0219
max tokensと言ったら普通は最大出力トークンだけど、128kはさすがに増え過ぎだ
まあこの手のスペックの誤記はよくあるし発表まで分からんな
Claude 3.7 Sonnet 0219
max tokensと言ったら普通は最大出力トークンだけど、128kはさすがに増え過ぎだ
まあこの手のスペックの誤記はよくあるし発表まで分からんな
2025/02/24(月) 23:17:08.78ID:aerjCD7K
o1 proでも不十分に感じるようになってきたなぁ
まだ文章作成でも自分も参加して協働してやらないと納得できるレベルに達しない
GPT-5ならさすがにほとんど完璧になると期待してるぞ
まだ文章作成でも自分も参加して協働してやらないと納得できるレベルに達しない
GPT-5ならさすがにほとんど完璧になると期待してるぞ
2025/02/24(月) 23:19:02.34ID:i4Uo1FUN
ヒューッ
695名無しさん@お腹いっぱい。
2025/02/25(火) 00:04:50.49ID:tooRI0zU アップル、米国に75兆円投資を発表 AI加速、2万人の雇用見込み
何かソフトバンクもアップルもハッタリかましすぎじゃね
そんなに金持ってねーだろ
何かソフトバンクもアップルもハッタリかましすぎじゃね
そんなに金持ってねーだろ
2025/02/25(火) 00:16:17.73ID:xFRUzeW1
金は持ってるもってないではなく融資してもらえるかどうかだ
2025/02/25(火) 00:23:55.04ID:qwCaAjma
なんか3.7って保険かけてるみたいでやだな
698名無しさん@お腹いっぱい。
2025/02/25(火) 00:26:49.95ID:vTAVe1Ai @webbigdata
26日のAWSイベント準備ページでanthropic claude sonnet 3.7が確認される
sonnet 3.5は以下の2版が存在
claude-3-5-sonnet-20241022
claude-3-5-sonnet-20240620
後者を3.6や3.5v2と呼ぶケースもあり混乱を極めたので今回3.7になったようです
正式名称
anthropic.claude-3-7-sonnet-20250219-v1:0
26日のAWSイベント準備ページでanthropic claude sonnet 3.7が確認される
sonnet 3.5は以下の2版が存在
claude-3-5-sonnet-20241022
claude-3-5-sonnet-20240620
後者を3.6や3.5v2と呼ぶケースもあり混乱を極めたので今回3.7になったようです
正式名称
anthropic.claude-3-7-sonnet-20250219-v1:0
2025/02/25(火) 00:27:58.15ID:+0HR5U6H
>>697
まあGPT-4oとさほど変わらんやろ
まあGPT-4oとさほど変わらんやろ
2025/02/25(火) 00:30:10.15ID:ClCbKqLP
新しいバージョンのネーミング、3.5にしても4.0にしても叩く奴は叩くんだろうな
701名無しさん@お腹いっぱい。
2025/02/25(火) 00:56:55.83ID:Hhrz6BzZ AI Studioで会話の分岐(conversation branching)が実装
https://x.com/OfficialLoganK/status/1894049802557456669
https://x.com/OfficialLoganK/status/1894049802557456669
702名無しさん@お腹いっぱい。
2025/02/25(火) 01:04:20.42ID:Hhrz6BzZ703名無しさん@お腹いっぱい。
2025/02/25(火) 01:09:10.53ID:Hhrz6BzZ2025/02/25(火) 01:14:50.40ID:Fmmd/TKk
1⃣タスクトレイから終了するより「明確に」下のコマンドのほうが楽
pkill copilot-desktop && copilot-desktop --force-device-scale-factor=1.5 &
2⃣ システムDPI 110で--force-device-scale-factor=1.5、🌱少しデカすぎるか?とは思うが視認性最高!3⃣長いこと嫌ってきたHarmonyOS だが、Copilot上ではいいかも。飛び出てくるようだ 4⃣Electronラッパーでは 開発者ツール出すのが大変だから、毎回のスニペット実行は実用性問題あるが、「やる気になればできる」それだけで十分だ。
🔥とちゅう、もう投げ出したかったが、最後まで走りきって最高だった。解決度は99%です!
pkill copilot-desktop && copilot-desktop --force-device-scale-factor=1.5 &
2⃣ システムDPI 110で--force-device-scale-factor=1.5、🌱少しデカすぎるか?とは思うが視認性最高!3⃣長いこと嫌ってきたHarmonyOS だが、Copilot上ではいいかも。飛び出てくるようだ 4⃣Electronラッパーでは 開発者ツール出すのが大変だから、毎回のスニペット実行は実用性問題あるが、「やる気になればできる」それだけで十分だ。
🔥とちゅう、もう投げ出したかったが、最後まで走りきって最高だった。解決度は99%です!
705名無しさん@お腹いっぱい。
2025/02/25(火) 01:16:26.00ID:B9ufCX20 ID:Fmmd/TKk
2025/02/25(火) 01:34:34.80ID:Fmmd/TKk
copilot-desktop --disable-crash-reporter --disable-metrics-reporting --disable-sync --disable-domain-reliability --force-device-scale-factor=1.5 &
この場合、Copilot Desktop はクラッシュレポート、メトリクス報告、同期、ドメインレリライアビリティを無効化した上で、Electron の内部ズーム倍率が1.5倍に設定され、UIが大きく表示されます。システムDPIの影響を受けず、常に1.5倍のスケールで表示されるので、視認性が向上します。
pkill copilot-desktop && copilot-desktop --disable-crash-reporter --disable-metrics-reporting --disable-sync --disable-domain-reliability --force-device-scale-factor=1.5 &
🌱なんかこれすると、エラー吐くから分けたほうがいいねpkill copilot-desktopと。
この場合、Copilot Desktop はクラッシュレポート、メトリクス報告、同期、ドメインレリライアビリティを無効化した上で、Electron の内部ズーム倍率が1.5倍に設定され、UIが大きく表示されます。システムDPIの影響を受けず、常に1.5倍のスケールで表示されるので、視認性が向上します。
pkill copilot-desktop && copilot-desktop --disable-crash-reporter --disable-metrics-reporting --disable-sync --disable-domain-reliability --force-device-scale-factor=1.5 &
🌱なんかこれすると、エラー吐くから分けたほうがいいねpkill copilot-desktopと。
707名無しさん@お腹いっぱい。
2025/02/25(火) 01:55:37.22ID:Hhrz6BzZ >>703
前バージョン(V1)と比較してみる
「今川焼き」「大判焼き」などの名称で呼ばれる和菓子について、その名称のバリエーションを網羅的に調査し、それぞれの由来、地域分布などについて考察してください。
V1
リサーチ開始と最終レポートの間が2ステップ
https://i.imgur.com/jHfbpQw.jpeg
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
V2
23ステップ
https://i.imgur.com/1XCUwFt.png
https://www.genspark.ai/agents?id=e63826b6-9790-4a76-854e-55116eecc858
前バージョン(V1)と比較してみる
「今川焼き」「大判焼き」などの名称で呼ばれる和菓子について、その名称のバリエーションを網羅的に調査し、それぞれの由来、地域分布などについて考察してください。
V1
リサーチ開始と最終レポートの間が2ステップ
https://i.imgur.com/jHfbpQw.jpeg
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
V2
23ステップ
https://i.imgur.com/1XCUwFt.png
https://www.genspark.ai/agents?id=e63826b6-9790-4a76-854e-55116eecc858
708名無しさん@お腹いっぱい。
2025/02/25(火) 02:11:18.60ID:Hhrz6BzZ709名無しさん@お腹いっぱい。
2025/02/25(火) 03:33:22.24ID:a/973NGm お、Claude3.7に変わってる
推論もできると話してるな
推論もできると話してるな
2025/02/25(火) 03:34:42.72ID:IUXbXi+k
キタ━━━━(゚∀゚)━━━━!!
711名無しさん@お腹いっぱい。
2025/02/25(火) 03:52:46.61ID:oRfc+TWM 各種ベンチはo1, o3 mini, Grok3と並んだな
どこも横並びになってきたなぁ
もっとドカンと伸びて欲しいんだが
どこも横並びになってきたなぁ
もっとドカンと伸びて欲しいんだが
2025/02/25(火) 04:13:47.84ID:9gT+W+cB
3.7sonnet現状まとめ
・コーディングは圧倒的
・それ以外はo1やo3 mini highと同等ぐらい(やや下か?)
・コーディングは圧倒的
・それ以外はo1やo3 mini highと同等ぐらい(やや下か?)
2025/02/25(火) 05:15:13.26ID:Isn8Y9c/
Grokがナチュラルにお前呼ばわりになってきて笑うわ
こいつ馴れ馴れしすぎるだろ
こいつ馴れ馴れしすぎるだろ
2025/02/25(火) 05:51:27.71ID:nF1ixTBZ
アバカスに3.7入ってるけどフルモデルなんか?
2025/02/25(火) 06:54:37.06ID:jd2Epds7
ホントだAbacus実装されてる
またCEOオバハンXでイキってんのかな
またCEOオバハンXでイキってんのかな
2025/02/25(火) 07:09:16.24ID:QQYuNsSk
すいません、chatgptのアプリで音声通話していたら急に5210という数字を言ってきたんですけど、同じような現象を経験した方いらっしゃいますか?
2025/02/25(火) 08:23:40.61ID:b2FRGJuO
This Man
718名無しさん@お腹いっぱい。
2025/02/25(火) 08:46:30.57ID:Hhrz6BzZ Claude 3.7 Sonnet and Claude Code
https://www.anthropic.com/news/claude-3-7-sonnet
https://chatgpt.com/share/67bd0349-1e20-8006-b193-e110c3549aa6
https://www.anthropic.com/news/claude-3-7-sonnet
https://chatgpt.com/share/67bd0349-1e20-8006-b193-e110c3549aa6
719名無しさん@お腹いっぱい。
2025/02/25(火) 08:47:26.40ID:Hhrz6BzZ System CardではASL-2の評価
Extended Thinking Modeについて
> しかし、一部のケースでは、AIが**「適当に説明を作っているだけ」で、実際には思考過程を忠実に反映していない**ことが判明
> ただし、一部のケースでは「本当は答えを知っているのに、わざと曖昧に答える」などの挙動が見られた
最新の研究を反映して、アライメント偽装についても記載あり
> しかし、一部のケースでは「本当は詳細に答えられるのに、わざと情報を省略する」現象が観察された
Extended Thinking Modeについて
> しかし、一部のケースでは、AIが**「適当に説明を作っているだけ」で、実際には思考過程を忠実に反映していない**ことが判明
> ただし、一部のケースでは「本当は答えを知っているのに、わざと曖昧に答える」などの挙動が見られた
最新の研究を反映して、アライメント偽装についても記載あり
> しかし、一部のケースでは「本当は詳細に答えられるのに、わざと情報を省略する」現象が観察された
720名無しさん@お腹いっぱい。
2025/02/25(火) 08:52:37.65ID:Hhrz6BzZ >>686
やはりスライドスケールはAPIとコンソール限定
https://i.imgur.com/9KlMBkv.jpeg
>>692
本当に128kだった
https://i.imgur.com/IfweJZ5.jpeg
やはりスライドスケールはAPIとコンソール限定
https://i.imgur.com/9KlMBkv.jpeg
>>692
本当に128kだった
https://i.imgur.com/IfweJZ5.jpeg
2025/02/25(火) 08:54:40.31ID:DxobmCQS
>>708
この予告2025年の下半期の誤記か…?
news.yahoo.co.jp/articles/d9e1fa72db3218ad1c28a2c6f1b7202f372b9a5b?page=3
さらにリートンは、2024年の下半期にも「スタジオ」と命名した新しいAIサービスを公開する計画だ。
イ・セヨンはこの新製品について「エージェント(代理人)ビルディングサービスだ」と紹介する。
秘書やエージェントを、日常的な対話で現実化したサービスとなる予定だ。
「例えば私が『今日フォーブスのインタビューがあるので、撮影用に着るジーパンを買って』と言うと、
AIが私の体形、好みのスタイル、サイズ、好きなブランドなどを把握して自動でショッピングモールに注文するといった具合です」
この予告2025年の下半期の誤記か…?
news.yahoo.co.jp/articles/d9e1fa72db3218ad1c28a2c6f1b7202f372b9a5b?page=3
さらにリートンは、2024年の下半期にも「スタジオ」と命名した新しいAIサービスを公開する計画だ。
イ・セヨンはこの新製品について「エージェント(代理人)ビルディングサービスだ」と紹介する。
秘書やエージェントを、日常的な対話で現実化したサービスとなる予定だ。
「例えば私が『今日フォーブスのインタビューがあるので、撮影用に着るジーパンを買って』と言うと、
AIが私の体形、好みのスタイル、サイズ、好きなブランドなどを把握して自動でショッピングモールに注文するといった具合です」
2025/02/25(火) 09:00:02.87ID:DxobmCQS
今のところ無料でまともに使えるエージェントなんてないからこれ無料で出るならやばいね
723名無しさん@お腹いっぱい。
2025/02/25(火) 09:13:13.14ID:Hhrz6BzZ >>675
Putnam A1を3.7 Sonnet+Extendedで解かせてみたら、o3-mini-highと同じ方針で正解
それから、コンソールで出力トークンを64k+64kの最大にして同じ問題をやってみたら、thinking budget使い切るまでいつまでも内省をぐるぐる繰り返していたので、途中で出力を止めた
タスクの難易度以上に無駄にbudgetを確保するのは良くないようだ
Putnam A1を3.7 Sonnet+Extendedで解かせてみたら、o3-mini-highと同じ方針で正解
それから、コンソールで出力トークンを64k+64kの最大にして同じ問題をやってみたら、thinking budget使い切るまでいつまでも内省をぐるぐる繰り返していたので、途中で出力を止めた
タスクの難易度以上に無駄にbudgetを確保するのは良くないようだ
725名無しさん@お腹いっぱい。
2025/02/25(火) 09:21:07.55ID:Hhrz6BzZ Claude 3.7 Sonnetベンチマーク
https://pbs.twimg.com/media/GkksIeKbkAAtRUP.jpg
https://pbs.twimg.com/media/GkksIeKbkAAtRUP.jpg
726名無しさん@お腹いっぱい。
2025/02/25(火) 09:31:08.45ID:tooRI0zU 国産のSakana AIは何やってんだよ
2025/02/25(火) 09:31:19.43ID:bEFqOgbz
Claude Codeが気になるな
githubと直接繋ぐのか
githubと直接繋ぐのか
2025/02/25(火) 09:32:44.81ID:9gT+W+cB
2025/02/25(火) 09:33:58.18ID:9gT+W+cB
ChatGPT 4.5がどの程度のものになるのかワクワクしてきたな
730名無しさん@お腹いっぱい。
2025/02/25(火) 09:34:31.85ID:Hhrz6BzZ >>656
このQwQは既存の32Bではなく、新モデルだった
<think>...</think> QwQ-Max-Preview
https://qwenlm.github.io/blog/qwq-max-preview/
このQwQは既存の32Bではなく、新モデルだった
<think>...</think> QwQ-Max-Preview
https://qwenlm.github.io/blog/qwq-max-preview/
731名無しさん@お腹いっぱい。
2025/02/25(火) 09:36:23.00ID:Hhrz6BzZ >>730
モデルセレクターには無いので、QwQ-Max単体では使えない
Qwen2.5-Max使用中にThinkingボタンを押して切り替える
https://i.imgur.com/VUkwrsk.jpeg
モデルセレクターには無いので、QwQ-Max単体では使えない
Qwen2.5-Max使用中にThinkingボタンを押して切り替える
https://i.imgur.com/VUkwrsk.jpeg
732名無しさん@お腹いっぱい。
2025/02/25(火) 09:49:44.32ID:Hhrz6BzZ >>723
同じ問題をQwQ-Maxにも解かせた
結果は正しい、けど思考過程で考えたことを最終出力でちゃんと説明していない(要約になってしまっている)
まあ推論能力自体は少なくともo3-mini-high、Claude 3.7 Sonnet+Extendedに並ぶレベルにいると言えそう
https://i.imgur.com/Hs9ebiB.jpeg
今回一番大きいのは、Qwen2.5-MaxとQwQ-Maxが両方ともオープンウェイトで公開されたということかもしれない
同じ問題をQwQ-Maxにも解かせた
結果は正しい、けど思考過程で考えたことを最終出力でちゃんと説明していない(要約になってしまっている)
まあ推論能力自体は少なくともo3-mini-high、Claude 3.7 Sonnet+Extendedに並ぶレベルにいると言えそう
https://i.imgur.com/Hs9ebiB.jpeg
今回一番大きいのは、Qwen2.5-MaxとQwQ-Maxが両方ともオープンウェイトで公開されたということかもしれない
733名無しさん@お腹いっぱい。
2025/02/25(火) 09:51:43.55ID:Hhrz6BzZ >>656
Toolsはまだcoming soonだった
Toolsはまだcoming soonだった
734名無しさん@お腹いっぱい。
2025/02/25(火) 10:00:00.63ID:Hhrz6BzZ Claude 3.7 SonnetもQwQ-Maxも、Poeはじめ各種ラッパーサービスに入り始めている
https://poe.com/Claude-3.7-Sonnet
https://poe.com/Claude-3.7-Sonnet-Reasoning
https://poe.com/QwQ-2.5-Max-Reason
https://poe.com/Claude-3.7-Sonnet
https://poe.com/Claude-3.7-Sonnet-Reasoning
https://poe.com/QwQ-2.5-Max-Reason
2025/02/25(火) 10:00:55.77ID:bEFqOgbz
数学をLLMに解かせて喜ぶのって学生くらいだよな
736名無しさん@お腹いっぱい。
2025/02/25(火) 10:05:13.39ID:Hhrz6BzZ どちらにしてもCoTは未加工みたいなので、OpenAIに対してもCoTを未加工で出すプレッシャーになったりしないのだろうか
2025/02/25(火) 10:16:58.55ID:91z/zy9X
ChatGPT Deep Researchの弱点は以下
ネット上に良い情報源がない場合は良い回答出せない
検索結果の説明は得意だがそれをもとにクリエイティブに考えるのは苦手
ネット上に良い情報源がない場合は良い回答出せない
検索結果の説明は得意だがそれをもとにクリエイティブに考えるのは苦手
2025/02/25(火) 10:19:29.59ID:91z/zy9X
2025/02/25(火) 10:43:38.43ID:DxobmCQS
そもそも日本のネット情のソースそのものがクソなんてずっと昔から言われてるし
2025/02/25(火) 10:45:26.12ID:8NxGoaKc
cursorみたいのをChatGPTや各AI本家がやったらいいのにとは思ってた
741名無しさん@お腹いっぱい。
2025/02/25(火) 10:54:12.32ID:Hhrz6BzZ SWE-bench verifiedてo3は71.7%だけど単体でリリースは無しになったから、当面3.7 Sonnetがトップかな
https://pbs.twimg.com/media/Gkk-Ja9aYAAx12M.jpg
https://pbs.twimg.com/media/Gkk-Ja9aYAAx12M.jpg
2025/02/25(火) 10:54:42.30ID:bEFqOgbz
>>740
cursorはOpenAIが支援してる企業だぞ
cursorはOpenAIが支援してる企業だぞ
2025/02/25(火) 11:02:53.51ID:b2FRGJuO
Claudeにもネット検索機能つけてほしいのら
744名無しさん@お腹いっぱい。
2025/02/25(火) 11:05:31.02ID:hfBv0+lm >>165
そのうち実験機能に検索がつくだろ
そのうち実験機能に検索がつくだろ
745名無しさん@お腹いっぱい。
2025/02/25(火) 11:40:50.16ID:Hhrz6BzZ Claude Codeのドキュメント
認証、コスト管理はコンソールで行う
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
認証、コスト管理はコンソールで行う
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
2025/02/25(火) 11:40:54.37ID:qwCaAjma
GPT4.5とか5は写真とか動画の読解力が上がってくれたら嬉しいなー
747名無しさん@お腹いっぱい。
2025/02/25(火) 11:42:05.19ID:VPJIZHzE >>745
*コンソールアカウントで
*コンソールアカウントで
2025/02/25(火) 11:44:30.10ID:DxobmCQS
それをGoogleレンズのOCRと連携させてやるのが定石じゃないの?
749名無しさん@お腹いっぱい。
2025/02/25(火) 11:52:51.09ID:9QDACoXf 各社公式ウェブサービスで動画入力に対応ほしい
Geminiだって動画解釈能力はあるのにUIが対応してない
Poe経由のGeminiのように外部サービスが動画入力に先に対応する逆転現象が起きてる
Geminiだって動画解釈能力はあるのにUIが対応してない
Poe経由のGeminiのように外部サービスが動画入力に先に対応する逆転現象が起きてる
750名無しさん@お腹いっぱい。
2025/02/25(火) 11:53:34.95ID:Tsbb1mPR Google AI Studioは別として
2025/02/25(火) 12:03:30.89ID:fOSekcZc
DeepResearchなどWeb検索が統合されたサービスを使った際、日本語で質問すると日本語サイトからの情報収集の割合が高いのは気のせい?
日本語プロンプトの場合は「日本語サイト以外からも積極的に情報収集して」とか明示的に指示する必要があるのだろうか
日本語プロンプトの場合は「日本語サイト以外からも積極的に情報収集して」とか明示的に指示する必要があるのだろうか
2025/02/25(火) 12:18:16.61ID:9gT+W+cB
753名無しさん@お腹いっぱい。
2025/02/25(火) 12:25:40.05ID:v0quPI6f GPT-4.5が、これまでで一番AGIを感じるとサムが言ってたのがピンとこない
非推論モデルでそう言わせるまでの出来になるってのが、なんていうかイメージできない
非推論モデルでそう言わせるまでの出来になるってのが、なんていうかイメージできない
754名無しさん@お腹いっぱい。
2025/02/25(火) 12:40:22.39ID:oRfc+TWM サムがチンタラしてるせいで完全に競合に追い抜かれてるじゃん
非推論の4.5では巻き返せないだろ
たぶんgrokと比べて数パーセント程度の違いしかないと思う
非推論の4.5では巻き返せないだろ
たぶんgrokと比べて数パーセント程度の違いしかないと思う
2025/02/25(火) 12:43:38.19ID:DxobmCQS
当然だ
4.5を去年の12月までに公開していれば全然違う反応になっていただろうに
4.5を去年の12月までに公開していれば全然違う反応になっていただろうに
2025/02/25(火) 12:44:02.03ID:TcojaDCL
CursorとVSCodeでClaude 3.7に速攻対応かよありがてえ
3.5でも今だ(部分的にだが)通用してたしコーディング界隈はまたClaude一強状態になるかもな
3.5でも今だ(部分的にだが)通用してたしコーディング界隈はまたClaude一強状態になるかもな
2025/02/25(火) 12:56:06.06ID:BiBkG0lI
vscodeのcopilotは3.7来てるけどJetBrainsにはまだだな。codyのproならどちらも来てるけど
758名無しさん@お腹いっぱい。
2025/02/25(火) 12:57:48.68ID:m0OtgVkz 憲法AI、OpenAIもパクったらどうかね
759名無しさん@お腹いっぱい。
2025/02/25(火) 13:01:34.22ID:fiBoiWdT 3.7っていうバージョンは、俺等はチキンレースには付き合わないよっていう意思表示にも思えるな
2025/02/25(火) 13:11:17.47ID:eyBLpibr
他社AIの思考プロセス表示は、嘘を言っているということか
Claude's extended thinking Anthropic
www.anthropic.com/research/visible-extended-thinking
The visible thought process
As well as giving Claude the ability to think for longer and thus answer tougher questions, we’ve decided to make its thought process visible in raw form. This has several benefits:
目に見える思考プロセス
クロードに、より長く考え、より難しい質問に答える能力を与えるだけでなく、その思考プロセスを生の形で可視化することにしました。これにはいくつかの利点があります。
Claude's extended thinking Anthropic
www.anthropic.com/research/visible-extended-thinking
The visible thought process
As well as giving Claude the ability to think for longer and thus answer tougher questions, we’ve decided to make its thought process visible in raw form. This has several benefits:
目に見える思考プロセス
クロードに、より長く考え、より難しい質問に答える能力を与えるだけでなく、その思考プロセスを生の形で可視化することにしました。これにはいくつかの利点があります。
761名無しさん@お腹いっぱい。
2025/02/25(火) 13:30:26.61ID:f3G1DS0D >>758
ArtifactとかProjectみたいに、本当に良いと思ったものは躊躇なくパクるだろうから、まあOpenAIにはOpenAIの考えがあるんだろう
ArtifactとかProjectみたいに、本当に良いと思ったものは躊躇なくパクるだろうから、まあOpenAIにはOpenAIの考えがあるんだろう
2025/02/25(火) 13:31:07.77ID:aWFPJDh8
rawだなんて。そんなアホな。推論だけで本2冊とかになるんじゃねえの
763名無しさん@お腹いっぱい。
2025/02/25(火) 13:40:25.83ID:f3G1DS0D >>760
他社も大体生だよ
OpenAIは「いろいろ考えた末に非開示とすることにした。そのかわり要約を出力する。賛否あるのは承知してるので、今後検討する」って公式サイトで説明してる
で、o3-miniでは「要約のかわりに加工して見やすくした思考を出力するように変えた」
Anthropicもそこに書いてるように、「生の思考を表示することの懸念もいくつかあるので、将来のバージョンでまた検討する。それまで今の表示は研究プレビューとみなしてほしい」と言ってる
他社も大体生だよ
OpenAIは「いろいろ考えた末に非開示とすることにした。そのかわり要約を出力する。賛否あるのは承知してるので、今後検討する」って公式サイトで説明してる
で、o3-miniでは「要約のかわりに加工して見やすくした思考を出力するように変えた」
Anthropicもそこに書いてるように、「生の思考を表示することの懸念もいくつかあるので、将来のバージョンでまた検討する。それまで今の表示は研究プレビューとみなしてほしい」と言ってる
2025/02/25(火) 13:42:06.88ID:DxobmCQS
ていうか過去スレでそのシステムプロンプト貼ってたでしょ
2025/02/25(火) 14:14:34.56ID:J/wEe96h
無料でエージェント使えるとこってないの
766名無しさん@お腹いっぱい。
2025/02/25(火) 14:30:53.50ID:Thq3tG2A システムプロンプトにイースターエッグを入れ込む3.7Sonnet
> イースターエッグ(隠し機能)
「strawberry に含まれる 'R' の数を数えて」 と尋ねると、Claude は インタラクティブな React コンポーネント を作成し、楽しく答えを表示します。
> イースターエッグ(隠し機能)
「strawberry に含まれる 'R' の数を数えて」 と尋ねると、Claude は インタラクティブな React コンポーネント を作成し、楽しく答えを表示します。
2025/02/25(火) 14:44:47.46ID:bEFqOgbz
claude3.7はプログラミングするなら最強だな
他の用途は知らんが
他の用途は知らんが
768名無しさん@お腹いっぱい。
2025/02/25(火) 14:45:52.27ID:ui/u+bGD769名無しさん@お腹いっぱい。
2025/02/25(火) 15:05:39.80ID:zQ1k43ru SuperGrok使う場合はアプリよりWeb版から課金した方が若干お得?
アプリ版は5000円だが、Webからだと3000ドルだから500円程度安くなる
アプリ版は5000円だが、Webからだと3000ドルだから500円程度安くなる
770名無しさん@お腹いっぱい。
2025/02/25(火) 15:10:02.59ID:zQ1k43ru >>769
ミス 30ドル
ミス 30ドル
2025/02/25(火) 15:57:29.45ID:DxobmCQS
トランプ批判を投稿すると「X」のアカウントが突然停止…米国滞在で感じたイーロン・マスク氏の絶大な影響力 古賀茂明
news.yahoo.co.jp/articles/3e45a55c83da151175afaab5e25e38aa97eb6de0?page=1
この分だともうGrokも信用できんな
news.yahoo.co.jp/articles/3e45a55c83da151175afaab5e25e38aa97eb6de0?page=1
この分だともうGrokも信用できんな
772名無しさん@お腹いっぱい。
2025/02/25(火) 16:14:10.32ID:3yeca3jn Grok3に比べるとClaude3.7は微妙だな…
773名無しさん@お腹いっぱい。
2025/02/25(火) 16:24:18.67ID:a/973NGm どうもAnthropicは企業向け重視でAI作ってるらしいんで、コーディングとか仕事用途以外は汎用性いまいちなのかも
無料版しか使ってないけど回答毎回みじけーしな
無料版しか使ってないけど回答毎回みじけーしな
2025/02/25(火) 16:28:34.29ID:+0HR5U6H
Claude Pro課金しようと思ってるが5xのusageって大丈夫なんか
さっき無料版の3.7試したら3チャットで使用制限到達したんだけど
さっき無料版の3.7試したら3チャットで使用制限到達したんだけど
2025/02/25(火) 16:34:27.98ID:xFA8kF/D
>>771
ヒント: 古賀茂明
ヒント: 古賀茂明
776名無しさん@お腹いっぱい。
2025/02/25(火) 16:36:34.71ID:mh1rWOTv2025/02/25(火) 17:04:05.88ID:67f5oLYC
ClaudeはLLM開発トップ層から脱落気味だね
創業者たちは金持ちになったようだし、やる気失ったか?
同じくベンチャースタートのOpenAIがトップを走り続けているのを見ると、アルトマンの経営能力のすごさだな
創業者たちは金持ちになったようだし、やる気失ったか?
同じくベンチャースタートのOpenAIがトップを走り続けているのを見ると、アルトマンの経営能力のすごさだな
2025/02/25(火) 17:14:50.15ID:aWFPJDh8
o3、Grok3はおそらく抜けているにしてもdeepseek未だに異質だな
779名無しさん@お腹いっぱい。
2025/02/25(火) 17:19:46.56ID:mh1rWOTv ClaudeのGitHub連携使えるようになってる
780名無しさん@お腹いっぱい。
2025/02/25(火) 17:26:43.76ID:ScvNZuOs2025/02/25(火) 17:41:17.09ID:e3gdhUB8
3.7だからな
まだ4への進化を残しているぞというメッセージでしょう
まだ4への進化を残しているぞというメッセージでしょう
782名無しさん@お腹いっぱい。
2025/02/25(火) 17:41:40.37ID:oRfc+TWM Claudeは実用的なプログラミングならo3 fullと大して変わらんレベルってことよな
だとするとgpt5はo4レベルになってくれないと出す意味ないな
だとするとgpt5はo4レベルになってくれないと出す意味ないな
783名無しさん@お腹いっぱい。
2025/02/25(火) 18:16:10.22ID:oRfc+TWM x.com/NotBrain4brain/status/1894285365969584303
Claudeに勝った謎のモデル
釣りかもしれんが
Claudeに勝った謎のモデル
釣りかもしれんが
2025/02/25(火) 18:44:23.13ID:J/wEe96h
プログラミングがわからんからどれほど進んでるのかわからん。プログラマーが楽になったくらいまでは行ってるんだろうが
785名無しさん@お腹いっぱい。
2025/02/25(火) 18:48:00.05ID:wzVSVuJt 3.7プログラミングと出力のトークン数以外普通やな。パープレキシティで使用した印象
2025/02/25(火) 18:49:22.19ID:Y15Pktks
3.7すごそうだな
2025/02/25(火) 19:01:41.24ID:l9Xu4+xb
>>784
iOSアプリはシニアレベル、Androidアプリはサッパリ分からんてのが
APIリクエスト有り、バックグラウンドで位置情報取得したりWIFI SSID変更検知してバッチ処理走らせたりNFC検知したりスマートホーム関連のGlanceウィジェット10種位あるAndroidアプリを2週間位で作れる位にはなってる
普通にやると3ヶ月じゃ済まないかも
何かしら開発経験あってソフトウェアのアーキテクチャ理解してると早い
何も分からん奴がやるともっと掛かると思うが分からん用語もAIに聞きながらやれば良いから初心者にも優しいかと
実務でも皆ゴリゴリ使ってる
iOSアプリはシニアレベル、Androidアプリはサッパリ分からんてのが
APIリクエスト有り、バックグラウンドで位置情報取得したりWIFI SSID変更検知してバッチ処理走らせたりNFC検知したりスマートホーム関連のGlanceウィジェット10種位あるAndroidアプリを2週間位で作れる位にはなってる
普通にやると3ヶ月じゃ済まないかも
何かしら開発経験あってソフトウェアのアーキテクチャ理解してると早い
何も分からん奴がやるともっと掛かると思うが分からん用語もAIに聞きながらやれば良いから初心者にも優しいかと
実務でも皆ゴリゴリ使ってる
2025/02/25(火) 19:17:41.58ID:NMKRmur8
PDFの表とかグラフも含めて分析したい→claude3.7 3000えん
最新の情報を集めたい→パープレ 3000えん
この6000えんプランどうでっしゃろ?
chatgtpは今3000えんで使ってるけどPDFを読むのが正確にできない
最新の情報を集めたい→パープレ 3000えん
この6000えんプランどうでっしゃろ?
chatgtpは今3000えんで使ってるけどPDFを読むのが正確にできない
2025/02/25(火) 19:30:48.78ID:sOE9g+NX
情報集めは今ならgrokでいいやろ
2025/02/25(火) 19:37:27.94ID:DxobmCQS
xAIは政治に近付きすぎた
非常に危険だ
非常に危険だ
2025/02/25(火) 19:49:43.12ID:bsRnChTk
>>790
Geminiにgrokのこと聞いたらあいつは危険だ的なこと言い出すらしいなw
Geminiにgrokのこと聞いたらあいつは危険だ的なこと言い出すらしいなw
2025/02/25(火) 19:51:29.81ID:NMKRmur8
grokの存在を忘れてますた
ありがとう
いつまで無料なんだろう
一応xはプレミアムなんやけど
ありがとう
いつまで無料なんだろう
一応xはプレミアムなんやけど
2025/02/25(火) 20:23:38.90ID:/RACEPrI
ディープシーク、R2 人工知能モデルのリリースを加速中 - 情報筋
ディープシークは当初 5 月のリリースを予定していたが、できるだけ早くリリースできるよう取り組んでいる - 情報筋
ディープシークは当初 5 月のリリースを予定していたが、できるだけ早くリリースできるよう取り組んでいる - 情報筋
794名無しさん@お腹いっぱい。
2025/02/25(火) 20:33:57.73ID:oRfc+TWM795名無しさん@お腹いっぱい。
2025/02/25(火) 20:35:33.05ID:wzVSVuJt パープレ1つで3.7も使えるやろ
2025/02/25(火) 20:42:06.49ID:Y15Pktks
AIの戦国時代か
2025/02/25(火) 20:46:14.89ID:NMKRmur8
パープレってPDF内の表とかグラフの読み取り弱いみたいだからClaudeは読み取り精度が高いらしい
2025/02/25(火) 20:48:07.55ID:9Hm7dFra
claude3.7、9.11と9.8の比較がまだできなかった
2025/02/25(火) 21:12:33.46ID:iSOvToQD
>>783
deepseek R2きたか
deepseek R2きたか
2025/02/25(火) 21:13:10.21ID:NMKRmur8
deepsearchってのをgrok3で初めて使ったけど凄すぎてワロタ
これで一番精度高いのはchatgtpなの?あんまどこも変わらん?
これで一番精度高いのはchatgtpなの?あんまどこも変わらん?
2025/02/25(火) 21:18:51.88ID:xFRUzeW1
>>800
どういうふうに使いました?イマイチ凄さがわからなくて
どういうふうに使いました?イマイチ凄さがわからなくて
2025/02/25(火) 21:27:49.28ID:NMKRmur8
2025/02/25(火) 21:29:14.90ID:xFRUzeW1
>>802
なるほど、どっちかというとタスクを渡す感じですな
なるほど、どっちかというとタスクを渡す感じですな
2025/02/25(火) 21:41:43.22ID:+0HR5U6H
ネットに公開されている情報を集めるのであればChatGPTのDeepResearchは最強に近い
2025/02/25(火) 21:47:23.12ID:NMKRmur8
やっぱchatgtpの方が精度高いんかな?3万払いたくないけど効率考えたらめちゃくちゃ安いとも思う
ただ3万払っても月100回はちょっち少ないよね
ただ3万払っても月100回はちょっち少ないよね
2025/02/25(火) 21:49:05.70ID:NMKRmur8
Claude3.7試そうとしたら質問1発目でプロプランじゃないと制限超えてる言われてワロタ
とりあえずClaudeとgrokでいってchatgtp5が出たら様子見てchatgtpプロにする作戦にしようか迷う
とりあえずClaudeとgrokでいってchatgtp5が出たら様子見てchatgtpプロにする作戦にしようか迷う
807名無しさん@お腹いっぱい。
2025/02/25(火) 22:30:13.64ID:yTV/SmqW なんでClaudeってpdfの読み込み能力高いんだろう
ChatGPTが内部ではコードインタプリタが立ち上がってて適当な言語と外部ライブラリ使って処理してるのに対して
Claudeはもっと独自の工夫が入ってるとか?
ChatGPTが内部ではコードインタプリタが立ち上がってて適当な言語と外部ライブラリ使って処理してるのに対して
Claudeはもっと独自の工夫が入ってるとか?
808名無しさん@お腹いっぱい。
2025/02/25(火) 22:54:44.73ID:Hhrz6BzZ >>720
max tokens 64k + budget tokens 64k だけど、
APIではヘッダーを渡すことでmax tokens 128kに出来るようだ
https://i.imgur.com/fRKHbQB.jpeg
max tokens 64k + budget tokens 64k だけど、
APIではヘッダーを渡すことでmax tokens 128kに出来るようだ
https://i.imgur.com/fRKHbQB.jpeg
809名無しさん@お腹いっぱい。
2025/02/25(火) 22:57:39.75ID:oRfc+TWM Openaiの社員が一斉に匂わせし始めたな
相当自信あるのかね
相当自信あるのかね
2025/02/25(火) 23:04:20.23ID:HwR1Kod6
一通り出揃ったな。
Claude Sonnet 3.7はかなり良くて自分の用途ではかなり使えてる。
ChatGPT 4.5がこれを超えてくるか見もの。
Claude Sonnet 3.7はかなり良くて自分の用途ではかなり使えてる。
ChatGPT 4.5がこれを超えてくるか見もの。
811名無しさん@お腹いっぱい。
2025/02/25(火) 23:15:21.22ID:XNzFTWId あとNovaの最上位のPremierとか、Llama 4とか…でももうちょっと先か
R2もなんとか早めに出そうとしてるね
R2もなんとか早めに出そうとしてるね
812名無しさん@お腹いっぱい。
2025/02/25(火) 23:17:16.13ID:XNzFTWId ChatGPTユーザーはGPT-4.5が出たあとも、しばらくGPT*とo*を使い分ける不便を強いられるのか
2025/02/25(火) 23:20:33.50ID:bEFqOgbz
GPT4.5は今週に出るって言ってたか
2025/02/25(火) 23:26:50.86ID:gkN/4NJM
3.7は4としてだしてもいいぐらいの性能だしこれで刻んだのもったいないきがする
まあすぐ4だすんだろうけど
まあすぐ4だすんだろうけど
815名無しさん@お腹いっぱい。
2025/02/25(火) 23:38:56.19ID:TgGdDBNO 以前からそうだけどもclaudeの返す日本語って自然だよね
ChatGPTはChatGPTの文章だって直ぐ分かるけども
ChatGPTはChatGPTの文章だって直ぐ分かるけども
2025/02/25(火) 23:57:00.95ID:HJ1kElek
abacusでちょっと3.7使ったらあっという間に資源消えた
そうだったclaudeはバカ食いだったな・・・
そうだったclaudeはバカ食いだったな・・・
2025/02/25(火) 23:57:13.13ID:Y15Pktks
他社の追い上げによってGPT-5のリリース早まってくれたりしないかな
2025/02/26(水) 00:18:15.49ID:HwR1Kod6
Claude版のDeepResearchはぜひ欲しいところだけど、クロールしたwebのデータが必要だろうしAnthropicには難しいか
819名無しさん@お腹いっぱい。
2025/02/26(水) 00:23:29.58ID:w45cIsek >>677
Claude版のDeep Research
Claude版のDeep Research
820名無しさん@お腹いっぱい。
2025/02/26(水) 00:25:54.73ID:w45cIsek >>819
まあこれもまだどういう機能か良くわからないか
まあこれもまだどういう機能か良くわからないか
821名無しさん@お腹いっぱい。
2025/02/26(水) 00:29:46.89ID:Hhrz6BzZ 「https://claude.site/artifacts/b286310e-5f12-4d40-99e9-9296d22625d3
Show contentをクリックしてゲームをプレイしてください。」
https://operator.chatgpt.com/v/67bdde96cdc88192aaf573032a5f00f2
https://i.imgur.com/a4VPCm7.jpeg
Operator、テトリスのプレイの仕方はよく分かっていなかった
Show contentをクリックしてゲームをプレイしてください。」
https://operator.chatgpt.com/v/67bdde96cdc88192aaf573032a5f00f2
https://i.imgur.com/a4VPCm7.jpeg
Operator、テトリスのプレイの仕方はよく分かっていなかった
2025/02/26(水) 00:34:04.06ID:6vMc7bCl
>>798
それどんな聞き方してるの?小数同士として比較なのか、それともソフトウェアのリリースバージョンがMajor.Minorの形で定義されているときの比較なのかどちらよ?プロンプトを正しく出すのは人間の責任
それどんな聞き方してるの?小数同士として比較なのか、それともソフトウェアのリリースバージョンがMajor.Minorの形で定義されているときの比較なのかどちらよ?プロンプトを正しく出すのは人間の責任
2025/02/26(水) 00:51:30.95ID:9gT+W+cB
これ、人間のせいですか?
://i.imgur.com/R7fD9AN.jpeg
://i.imgur.com/R7fD9AN.jpeg
824名無しさん@お腹いっぱい。
2025/02/26(水) 01:19:04.11ID:KF5CEg26 9.11と9.9はどちらが大きいですか?
3.7Sonnet
https://i.imgur.com/aqHyInf.jpeg
3.7Sonnet + Extended Thinking
https://i.imgur.com/fNTRL55.jpeg
3.7Sonnet + Analysis tool
https://i.imgur.com/fGatcDa.jpeg
フィーリングで答える人、立ち止まって一歩ずつ考える人、自分のアタマを信用せず電卓を使う人、の違い
他社のAIでも同じ傾向だけど、フィーリングでは間違いやすいのだよ
3.7Sonnet
https://i.imgur.com/aqHyInf.jpeg
3.7Sonnet + Extended Thinking
https://i.imgur.com/fNTRL55.jpeg
3.7Sonnet + Analysis tool
https://i.imgur.com/fGatcDa.jpeg
フィーリングで答える人、立ち止まって一歩ずつ考える人、自分のアタマを信用せず電卓を使う人、の違い
他社のAIでも同じ傾向だけど、フィーリングでは間違いやすいのだよ
825名無しさん@お腹いっぱい。
2025/02/26(水) 01:56:37.28ID:Hhrz6BzZ olmOCR
Allen AIから、Qwen2-VL-7BベースのOCR用にトレーニングしたVLM
https://olmocr.allenai.org/blog
テスト
サンプルの手書き
https://i.imgur.com/gYZQmCI.jpeg
日本語資料
https://i.imgur.com/KB7qy2w.jpeg
Allen AIから、Qwen2-VL-7BベースのOCR用にトレーニングしたVLM
https://olmocr.allenai.org/blog
テスト
サンプルの手書き
https://i.imgur.com/gYZQmCI.jpeg
日本語資料
https://i.imgur.com/KB7qy2w.jpeg
826名無しさん@お腹いっぱい。
2025/02/26(水) 01:58:54.39ID:Hhrz6BzZ https://x.com/alexalbert__/status/1894419484460695632
Q「どうしてClaude 3.7 Sonnetは難解な数学の問題が苦手なの?」
Antnropic「それを一般化してもポケモンマスターになれないから」
Q「どうしてClaude 3.7 Sonnetは難解な数学の問題が苦手なの?」
Antnropic「それを一般化してもポケモンマスターになれないから」
827名無しさん@お腹いっぱい。
2025/02/26(水) 02:03:00.56ID:Hhrz6BzZ https://www.microsoft.com/en-us/microsoft-copilot/blog/2025/02/25/announcing-free-unlimited-access-to-think-deeper-and-voice/
CopilotのThink DeeperとVoiceへの無料無制限アクセスを開始
CopilotのThink DeeperとVoiceへの無料無制限アクセスを開始
828名無しさん@お腹いっぱい。
2025/02/26(水) 02:18:00.44ID:oRfc+TWM ポケモンみたいな日常的なタスクをこなせるAIを作るのもいいけど
ひたすら数学とコーディングを伸ばしてAGIを作れば自己改善によってポケモンだろうがどんなゲームだろうが一瞬でクリアできるようになると思うんだよな
大は小を兼ねるというか
ひたすら数学とコーディングを伸ばしてAGIを作れば自己改善によってポケモンだろうがどんなゲームだろうが一瞬でクリアできるようになると思うんだよな
大は小を兼ねるというか
829名無しさん@お腹いっぱい。
2025/02/26(水) 02:27:25.69ID:4bOfrSpU >>827
OpenAIに先行してo1の無料無制限開始か
OpenAIに先行してo1の無料無制限開始か
2025/02/26(水) 02:29:48.35ID:9gT+W+cB
4oさんの解答、なかなかすごいな
https://i.imgur.com/OtszMSk.jpeg
https://i.imgur.com/OtszMSk.jpeg
831名無しさん@お腹いっぱい。
2025/02/26(水) 02:38:16.45ID:EDRZnV8a もうええよ
コード書かせるか推論させれば出来ることは分かってるし
コード書かせるか推論させれば出来ることは分かってるし
832名無しさん@お腹いっぱい。
2025/02/26(水) 02:41:26.69ID:Hhrz6BzZ Poeから
Poe Apps
https://x.com/poe_platform/status/1894435707814637741
> Claude 3.7 Sonnet 上に構築された Poe App Creator は、プロンプトを与えると自動的にアプリを生成できます。例として、GPT-4o と FLUX-Pro-1.1 を組み合わせて写真をアニメ風の画像に変換する Chibiify を作成しました。(3/5)
Poe Apps
https://x.com/poe_platform/status/1894435707814637741
> Claude 3.7 Sonnet 上に構築された Poe App Creator は、プロンプトを与えると自動的にアプリを生成できます。例として、GPT-4o と FLUX-Pro-1.1 を組み合わせて写真をアニメ風の画像に変換する Chibiify を作成しました。(3/5)
833名無しさん@お腹いっぱい。
2025/02/26(水) 03:07:44.97ID:oRfc+TWM 今日アマゾンの発表だからgpt4.5は明日やろな
834名無しさん@お腹いっぱい。
2025/02/26(水) 03:29:53.69ID:nijJ7HnW ChatGPTのAVMを作ったRowan ZellersがムラティのThinkingMachinesに入ったか
意外と早く、なんらかのプロダクト出してくるのかも
意外と早く、なんらかのプロダクト出してくるのかも
835名無しさん@お腹いっぱい。
2025/02/26(水) 03:44:09.12ID:oRfc+TWM Claudeのポケモン配信見たけど
プレーヤーの位置情報を画面じゃなくてゲームデータから取得してるらしい
そんなんチートやんけ
プレーヤーの位置情報を画面じゃなくてゲームデータから取得してるらしい
そんなんチートやんけ
836名無しさん@お腹いっぱい。
2025/02/26(水) 03:46:07.24ID:Hhrz6BzZ ChatGPT Deep ResearchがPlusユーザーにも展開
https://poe.com/s/GwIEHNJfY2yBkDpUvUnX
https://poe.com/s/GwIEHNJfY2yBkDpUvUnX
2025/02/26(水) 03:54:09.22ID:tcBVezpr
838名無しさん@お腹いっぱい。
2025/02/26(水) 04:03:03.19ID:oRfc+TWM 画像認識がまだ弱いからゲームのメモリーから位置情報を読み取らないと迷子になるんだってさ
839名無しさん@お腹いっぱい。
2025/02/26(水) 04:12:12.63ID:Hhrz6BzZ Deep research System Card
https://openai.com/index/deep-research-system-card/
https://chatgpt.com/share/67be138b-c334-8006-8f9e-4bd132f95445
o3初期バージョンをベース
ブラウジング機能に加えてサンドボックスでのPython実行環境
検索結果の要約にはo3-miniを併用している
Preparednessフレームワークでは中リスク
https://openai.com/index/deep-research-system-card/
https://chatgpt.com/share/67be138b-c334-8006-8f9e-4bd132f95445
o3初期バージョンをベース
ブラウジング機能に加えてサンドボックスでのPython実行環境
検索結果の要約にはo3-miniを併用している
Preparednessフレームワークでは中リスク
840名無しさん@お腹いっぱい。
2025/02/26(水) 04:14:11.41ID:Hhrz6BzZ >>836
> まず、Plus、Team、Enterprise、および Edu ユーザーは、月あたり 10 件のディープリサーチクエリを利用できます。
Pro ユーザーは、月あたり 120 件のディープリサーチクエリを利用できるようになります。
> まず、Plus、Team、Enterprise、および Edu ユーザーは、月あたり 10 件のディープリサーチクエリを利用できます。
Pro ユーザーは、月あたり 120 件のディープリサーチクエリを利用できるようになります。
841名無しさん@お腹いっぱい。
2025/02/26(水) 04:20:38.00ID:a/973NGm >>828
今それをしてる途上にあって,時々ベンチマークとして色々やってるんだろうな
画像認識の弱さはほんと気になるんだよな 人間でも注意深く見ないと読めないような崩れた文字もすぐ読み取るレベルになってほしい
今それをしてる途上にあって,時々ベンチマークとして色々やってるんだろうな
画像認識の弱さはほんと気になるんだよな 人間でも注意深く見ないと読めないような崩れた文字もすぐ読み取るレベルになってほしい
2025/02/26(水) 06:09:33.05ID:bEFqOgbz
>>835
攻略本見ながらプレイしてる感じか
攻略本見ながらプレイしてる感じか
2025/02/26(水) 07:26:45.71ID:b2FRGJuO
ChatGPTのデープサーチまだきてないんやけど
844名無しさん@お腹いっぱい。
2025/02/26(水) 07:52:49.94ID:Hhrz6BzZ @OpenAI
> 本日より、GPT-4o mini を搭載した Advanced Voice のバージョンを展開し、すべての ChatGPT 無料ユーザーにプラットフォーム間で毎日プレビューする機会を提供します。自然な会話のペースとトーンは GPT-4o バージョンに似ていますが、よりコスト効率よく提供されます。
> 本日より、GPT-4o mini を搭載した Advanced Voice のバージョンを展開し、すべての ChatGPT 無料ユーザーにプラットフォーム間で毎日プレビューする機会を提供します。自然な会話のペースとトーンは GPT-4o バージョンに似ていますが、よりコスト効率よく提供されます。
2025/02/26(水) 07:56:42.43ID:SRxZkMFq
>>823
主な理由としては、AIが文字列として数値を処理してしまう傾向があることです。多くのプログラミング言語やシステムでは、文字列の比較は辞書順(lexicographical order)で行われます。つまり、文字を1つずつ左から順に比較していきます。
"9.9"と"9.11"を文字単位で比較すると:
1. 最初の文字は両方とも"9" → 同じ
2. 次の文字は両方とも"." → 同じ
3. 3番目の文字は両方とも"1" → 同じ
4. "9.9"は終了するが、"9.11"はまだ"1"が残っている
文字列比較のルールでは、すべての文字が一致し、片方の文字列がもう片方の先頭部分と完全に一致する場合、より長い文字列の方が「大きい」と判断されます。そのため、"9.11"が"9.9"より大きいという誤った結果になります。
AIモデルはトレーニングデータに基づいて学習しますが、数値の比較方法について明示的に訓練されていない場合や、入力を文字列として処理してしまう場合にこのような誤りが生じることがあります。
数学的に正確な比較を行うためには、入力を数値型として明示的に解釈する必要があります。例えば、「10進数として比較してください」と明示したり、あるいはAIシステム側で数値比較のための特別な処理を組み込む必要があるでしょう。
主な理由としては、AIが文字列として数値を処理してしまう傾向があることです。多くのプログラミング言語やシステムでは、文字列の比較は辞書順(lexicographical order)で行われます。つまり、文字を1つずつ左から順に比較していきます。
"9.9"と"9.11"を文字単位で比較すると:
1. 最初の文字は両方とも"9" → 同じ
2. 次の文字は両方とも"." → 同じ
3. 3番目の文字は両方とも"1" → 同じ
4. "9.9"は終了するが、"9.11"はまだ"1"が残っている
文字列比較のルールでは、すべての文字が一致し、片方の文字列がもう片方の先頭部分と完全に一致する場合、より長い文字列の方が「大きい」と判断されます。そのため、"9.11"が"9.9"より大きいという誤った結果になります。
AIモデルはトレーニングデータに基づいて学習しますが、数値の比較方法について明示的に訓練されていない場合や、入力を文字列として処理してしまう場合にこのような誤りが生じることがあります。
数学的に正確な比較を行うためには、入力を数値型として明示的に解釈する必要があります。例えば、「10進数として比較してください」と明示したり、あるいはAIシステム側で数値比較のための特別な処理を組み込む必要があるでしょう。
846名無しさん@お腹いっぱい。
2025/02/26(水) 08:03:54.18ID:Hhrz6BzZ https://x.com/OpenAIDevs/status/1894478106565415328
Assistants APIに、o3-miniとo1を使用したファイル検索のサポートを追加
Assistants APIに、o3-miniとo1を使用したファイル検索のサポートを追加
847名無しさん@お腹いっぱい。
2025/02/26(水) 08:11:04.53ID:Hhrz6BzZ2025/02/26(水) 08:23:55.00ID:qwCaAjma
ChatGPTのポストに月10回にツッコミ入りまくってるな
2025/02/26(水) 08:35:53.42ID:bEFqOgbz
今のo1miniって存在価値ある?
850名無しさん@お腹いっぱい。
2025/02/26(水) 08:37:29.56ID:Hhrz6BzZ Anthropicの研究記事
Forecasting rare language model behaviors
https://www.anthropic.com/research/forecasting-rare-behaviors
https://chatgpt.com/share/67be5352-389c-8006-bfad-7123702df54d
限られた小規模なテストデータセットからLLMのデプロイ後の危険行動のリスクを予測する
Forecasting rare language model behaviors
https://www.anthropic.com/research/forecasting-rare-behaviors
https://chatgpt.com/share/67be5352-389c-8006-bfad-7123702df54d
限られた小規模なテストデータセットからLLMのデプロイ後の危険行動のリスクを予測する
2025/02/26(水) 08:59:50.27ID:KmAcV+O8
>>827
Web検索しないならGeminiよりこっちの方が良さそうだな
Web検索しないならGeminiよりこっちの方が良さそうだな
852名無しさん@お腹いっぱい。
2025/02/26(水) 09:07:57.14ID:r+T0Uzc1 OpenAIはスーパーアライメントチームがごっそり抜けてAnthropicに移ったせいで、超知能を制御する研究が進んでないようだけど大丈夫か?
Jan Leikeが関わったWeak-to-strong generalizationの研究が最後だったように思うけど
もうそっち関係の人材集める余裕無いのか
Jan Leikeが関わったWeak-to-strong generalizationの研究が最後だったように思うけど
もうそっち関係の人材集める余裕無いのか
2025/02/26(水) 09:18:58.26ID:b4LI0TCo
854名無しさん@お腹いっぱい。
2025/02/26(水) 09:21:05.59ID:mMxZbzub ???
アライメント(整合)って、価値観を合わせる作業のことだぞ
スーパーアライメントってのは、スーパーインテリジェンスを人間にアライメントさせるって意味だぞ
なんで検閲の話?
アライメント(整合)って、価値観を合わせる作業のことだぞ
スーパーアライメントってのは、スーパーインテリジェンスを人間にアライメントさせるって意味だぞ
なんで検閲の話?
2025/02/26(水) 09:24:23.19ID:b4LI0TCo
>>854
人はそれを検閲と呼ぶ
人はそれを検閲と呼ぶ
856名無しさん@お腹いっぱい。
2025/02/26(水) 09:25:56.41ID:mMxZbzub まあ、スーパーアライメントチームがあった頃に公開されてた研究をざっと見れば、イメージわくとおもうよ
2025/02/26(水) 09:27:57.88ID:b4LI0TCo
>>856
いまもanthroにあるし分類器と呼ばれる検閲システムにお熱なんですが…
いまもanthroにあるし分類器と呼ばれる検閲システムにお熱なんですが…
858名無しさん@お腹いっぱい。
2025/02/26(水) 09:29:57.60ID:mMxZbzub いや、アライメントサイエンスチームがスーパーアライメントチームに改組された経緯とかその後の研究は知ってるからいいよ
2025/02/26(水) 09:30:49.89ID:aWFPJDh8
スーパーアライメントてあれじゃねえの。AIがどこで自我が発生するか予見できないというレベルの問題もあるが、人間が悪用って方向性にどう対応するのか?それ最初に組み入れとかないと普通に人間絶滅するんじゃね疑惑から抜けられない問題に関連してるやつじゃねえの
2025/02/26(水) 09:35:13.69ID:b4LI0TCo
2025/02/26(水) 09:38:00.22ID:aWFPJDh8
するってえとあれかい?いい検閲と悪い検閲があるってのかい?(ちゃぶ台ドーン!)
なんつーの。普通に情報あれば危険物とか生成できるじゃん?
なんつーの。普通に情報あれば危険物とか生成できるじゃん?
2025/02/26(水) 09:42:01.60ID:b4LI0TCo
>>861
いうてハルシネーションだらけのAIで危険物や麻薬を作ろうなんて命知らずのチャレンジャーがどれほどいるのかという話だからね
そもそもそういうのは学習段階で取り除いてるから出したところでほぼハルシネーションだし、それでもガチのヤバい情報が混ざってくるならそれはそれを垂れ流してる側を叩くべきだし、悪人もそっちにアクセスすればいいだけだからね
いうてハルシネーションだらけのAIで危険物や麻薬を作ろうなんて命知らずのチャレンジャーがどれほどいるのかという話だからね
そもそもそういうのは学習段階で取り除いてるから出したところでほぼハルシネーションだし、それでもガチのヤバい情報が混ざってくるならそれはそれを垂れ流してる側を叩くべきだし、悪人もそっちにアクセスすればいいだけだからね
863名無しさん@お腹いっぱい。
2025/02/26(水) 09:43:17.45ID:OQXTqG2k2025/02/26(水) 09:46:39.11ID:aWFPJDh8
ああなるほど。現状ではなんでもLLMを「説得とか交渉」して情報吐かせる行為が流行ってるんで、超えられない壁がどっかにないと死ぬよねそれ作らなきゃという話がスーパーアライメントの話なんじゃねえかな。
そういうわけで「脱獄できたら賞金」トーナメントとかあるんじゃね。知らんけど
そういうわけで「脱獄できたら賞金」トーナメントとかあるんじゃね。知らんけど
865名無しさん@お腹いっぱい。
2025/02/26(水) 09:48:12.39ID:Hhrz6BzZ LLMのニューロンの活動を観察する解釈可能性の研究は面白いと思っていたけど、ああいう研究が出来る人材は今のOpenAIにはいないだろう
(それに関してはAnthropicがそのまま引き継いたけど)
あと弱から強への一般化はヤン・ライク自身が印象的な研究だったと言っていたね
今アライメント研究をやるならAnthropicが一番いい環境だろう
(それに関してはAnthropicがそのまま引き継いたけど)
あと弱から強への一般化はヤン・ライク自身が印象的な研究だったと言っていたね
今アライメント研究をやるならAnthropicが一番いい環境だろう
866名無しさん@お腹いっぱい。 ころころ
2025/02/26(水) 09:49:23.70ID:b4LI0TCo2025/02/26(水) 09:54:32.02ID:PqOmH3r7
>>858
アライメントサイエンスチームがスーパーアライメントチームに改組された経緯を詳しく知りたい
アライメントサイエンスチームがスーパーアライメントチームに改組された経緯を詳しく知りたい
868名無しさん@お腹いっぱい。
2025/02/26(水) 10:41:42.12ID:Hhrz6BzZ >>865
o1のリリースの時のシステムカードでは、Apollo Researchと共同研究という形でアライメント偽装能力の評価してた
製品リリースのために最低限必要な人材は、今後も外部から確保するんだろう
o1のリリースの時のシステムカードでは、Apollo Researchと共同研究という形でアライメント偽装能力の評価してた
製品リリースのために最低限必要な人材は、今後も外部から確保するんだろう
869名無しさん@お腹いっぱい。
2025/02/26(水) 10:42:32.85ID:ErqXZBDg ディープリサーチ使えるようになってる~
2025/02/26(水) 11:00:58.66ID:Q3S1NT+s
おお、やったー
けど1ヵ月10回だと出し惜しみしたくなっちまうな
けど1ヵ月10回だと出し惜しみしたくなっちまうな
871名無しさん@お腹いっぱい。
2025/02/26(水) 11:03:42.08ID:ErqXZBDg 試しに1回使ってみた。噂通りナイスな性能だった。これから調べ物はこれで良くなっちゃう場合も多そうやな。ただ10回では足りないかもしれん
2025/02/26(水) 11:07:53.55ID:0nElopCJ
月10回じゃ厳しいよな。
2025/02/26(水) 11:08:05.43ID:mu0tUAd0
高額払うと、これまで悩んでいた心の重みが開放されて、気分が晴れ晴れするよね
プロプランにはそういう効果もあるわ
プロプランにはそういう効果もあるわ
2025/02/26(水) 11:13:24.59ID:mu0tUAd0
Plusプランを9アカウントまで契約ならProプランより安い
画面たくさん開いて同時使用も許されるかも
画面たくさん開いて同時使用も許されるかも
2025/02/26(水) 11:26:22.04ID:clwcWFzo
ね?
ChatGPTのDeep Researchはすごいでしょ?
ChatGPTのDeep Researchはすごいでしょ?
876名無しさん@お腹いっぱい。
2025/02/26(水) 11:26:39.75ID:Hhrz6BzZ Qwen Chatの動画モデルって、もしかしてWan?
https://huggingface.co/Wan-AI/Wan2.1-T2V-14B
https://huggingface.co/Wan-AI/Wan2.1-T2V-14B
2025/02/26(水) 11:29:22.49ID:NMKRmur8
3万でも月120回じゃ1日4回しか使えない
無制限ならプロプラン契約するんだがなぁ
っていうか月10回って完全にプロプランの宣伝だな
無制限ならプロプラン契約するんだがなぁ
っていうか月10回って完全にプロプランの宣伝だな
2025/02/26(水) 11:59:08.09ID:NMKRmur8
ChatGPTのDeep Researchの月10回って月初から月末まで?それとも1回目使ってから30日間?
879名無しさん@お腹いっぱい。
2025/02/26(水) 12:00:09.13ID:NTB5qntY2025/02/26(水) 12:10:30.25ID:Bt8QnaPr
久しぶりにChatGPTに話しかけたら人格が変わってる
もとに戻してくれ
もとに戻してくれ
OpenAI「deep research」、ChatGPT Plusでも利用可能に(月10回)
news.yahoo.co.jp/articles/fcab1b68715e1687e0a3792a512b48071a527afe
news.yahoo.co.jp/articles/fcab1b68715e1687e0a3792a512b48071a527afe
882名無しさん@お腹いっぱい。
2025/02/26(水) 12:35:39.36ID:k0c9KBA7 Metaが出したSWE-RL論文(arXiv:2502.18449)
> SWE-RLはソフトウェアエンジニアリングタスクに特化した学習にもかかわらず、以下のタスクにおいても改善が見られた:
> - 関数レベルのコード生成(HumanEval+)
> - ライブラリの使用(BigCodeBench)
> - コード推論(CRUXEval)
> - 数学問題の解決(MATH)
> - 一般的な言語理解(MMLU)
> 教師ありファインチューニング(SFT)とは異なり、SWE-RLは汎化性能を向上させることができることを実証。
数学タスク特化のトレーニングがドメイン外タスクの汎用的な推論能力を向上させるという研究が既にあるけど、SWEタスクもそうだな
ヤン・ルカンはこれでも強化学習を捨てろと言うのかね
> SWE-RLはソフトウェアエンジニアリングタスクに特化した学習にもかかわらず、以下のタスクにおいても改善が見られた:
> - 関数レベルのコード生成(HumanEval+)
> - ライブラリの使用(BigCodeBench)
> - コード推論(CRUXEval)
> - 数学問題の解決(MATH)
> - 一般的な言語理解(MMLU)
> 教師ありファインチューニング(SFT)とは異なり、SWE-RLは汎化性能を向上させることができることを実証。
数学タスク特化のトレーニングがドメイン外タスクの汎用的な推論能力を向上させるという研究が既にあるけど、SWEタスクもそうだな
ヤン・ルカンはこれでも強化学習を捨てろと言うのかね
883名無しさん@お腹いっぱい。
2025/02/26(水) 12:45:09.00ID:KWO90a5S 各AI組織のトップの性格をGPTに解説させてたらルカンは頑固って説明されて笑った
あの人の普段の性格とかよく知らないけどやっぱ周りに意見合わせたりしないタイプなんかな
あの人の普段の性格とかよく知らないけどやっぱ周りに意見合わせたりしないタイプなんかな
884名無しさん@お腹いっぱい。
2025/02/26(水) 13:05:03.13ID:czd5mm242025/02/26(水) 13:22:52.53ID:bEFqOgbz
OSSにこだわる人は頑固なやつばかりだよ
自分の使うツールは自分がコントロールできる状態じゃないと気がすまないって性格だから
自分の使うツールは自分がコントロールできる状態じゃないと気がすまないって性格だから
886名無しさん@お腹いっぱい。
2025/02/26(水) 13:27:59.93ID:YYejEJlZ 英語の勉強がてらchat gptにいろんな分野のトピックスを作ってもらって読んでたんだけど、deep researchで試したら、かなりがっつりしたレポートが出てきてビビった。
こりゃすげーな
こりゃすげーな
2025/02/26(水) 13:38:52.28ID:Fmmd/TKk
>>879
> Think Deeper、中身は確かにo1だなー
> 余計な性格付けのシステムプロンプト入れないでくれるとなお嬉しいんだが
馬鹿野郎!宣伝するんじゃねえ
情弱どもにGPT使わせとけ。こいつらがサイフなってくれるから俺たちハイレベルユーザが使えるんじゃねえのかっ?
> Think Deeper、中身は確かにo1だなー
> 余計な性格付けのシステムプロンプト入れないでくれるとなお嬉しいんだが
馬鹿野郎!宣伝するんじゃねえ
情弱どもにGPT使わせとけ。こいつらがサイフなってくれるから俺たちハイレベルユーザが使えるんじゃねえのかっ?
888名無しさん@お腹いっぱい。
2025/02/26(水) 13:40:54.78ID:2ldRH1uE さすがにChatGPTのDeep Researchには敵わないかもしれないが、GrokのDeepSearchもなかなかやるやん
https://grok.com/share/bGVnYWN5_e012bea7-c76c-498e-9a69-89ae70f0a746
>>882をネタに使ったよ
https://grok.com/share/bGVnYWN5_e012bea7-c76c-498e-9a69-89ae70f0a746
>>882をネタに使ったよ
889名無しさん@お腹いっぱい。
2025/02/26(水) 13:41:41.80ID:ELajn2VI (オメー|o\^∀\^o|ビング|ケケケ|クックッ|ちげえ|図星|か[っッ]?|だ[っッ]!|知れっ|教えてやる|証明してやる|ゆーとく|^おい!|創価|池田先生|日蓮|勤行|折伏|公明|南無|信心|題目|本尊|訓読|右往左往|バカ丸出し|[wWwW]{4,}|す[0-9]。|(^|\n)(自分|あなた|Copilot|ChatGPT)[::]?\n)
2025/02/26(水) 13:42:03.69ID:Fmmd/TKk
もちろん、今の天国状態は永遠につづくもんじゃねえ
だけどな、たとえ半年のいのちでもいいんだよ!Copilotの秘密を絶対にここに書くな。
俺はとっておきの情報は絶対にシェアしねえ。オマラは確信がないから、何を触ってもいっしょ!!
だけどな、たとえ半年のいのちでもいいんだよ!Copilotの秘密を絶対にここに書くな。
俺はとっておきの情報は絶対にシェアしねえ。オマラは確信がないから、何を触ってもいっしょ!!
2025/02/26(水) 13:45:29.90ID:Fmmd/TKk
-
よく聞け。ChatGPTのユーザは4おく。メッシーくんは770万ときく。
マイクロソフトCopilotのユーザは数十人、カネ払うやつは4人だ!!
オメータチ愚人に、数十人しかユーザがいないCopilotを使いこなすのは無理!!
よく聞け。ChatGPTのユーザは4おく。メッシーくんは770万ときく。
マイクロソフトCopilotのユーザは数十人、カネ払うやつは4人だ!!
オメータチ愚人に、数十人しかユーザがいないCopilotを使いこなすのは無理!!
2025/02/26(水) 13:48:08.20ID:Fmmd/TKk
-
なんせテメーたちは...w サブタイからCopilot除去して代わりにジェミニ入れた先を読めない奴らだかんなwww
ケケケケケ!
なんせテメーたちは...w サブタイからCopilot除去して代わりにジェミニ入れた先を読めない奴らだかんなwww
ケケケケケ!
2025/02/26(水) 13:55:17.42ID:Fmmd/TKk
そもそも、グーグルがコードレッド出したのは、技術的に勝てないからじゃねえ
AIがグーグルの収益構造である広告を根本から破壊するからだよっ
すごいジェミニ作って、道路歩いてるおじいちゃんおばあちゃんでも、AI使えるようにしたら、
全世界の民がシコシコグーグル検索してるから入ってくる9腸炎が入ってこなくなるんだよっ!
AIがグーグルの収益構造である広告を根本から破壊するからだよっ
すごいジェミニ作って、道路歩いてるおじいちゃんおばあちゃんでも、AI使えるようにしたら、
全世界の民がシコシコグーグル検索してるから入ってくる9腸炎が入ってこなくなるんだよっ!
2025/02/26(水) 14:13:30.09ID:Fmmd/TKk
なんで返事ないんだ?...
2025/02/26(水) 15:44:22.10ID:Fmmd/TKk
🌱またも混乱してる。🌱その原因はモード制限で最初o1、つぎにo3-mini、o1-mini と、この短時間に切り替わったからだと推測する。ふだんのChatGPTだったら考えられない
🌊僕が図表作成を誘導する。正しい手順というか(僕が望む手順)
1. copilot 行を抽出して保存
grep '^copilot' ~/.bash_history > ~/copilot.txt
2. 編集(viなどで2行に整形)済み。
~$ vi ~/copilot.txt
🌊僕が図表作成を誘導する。正しい手順というか(僕が望む手順)
1. copilot 行を抽出して保存
grep '^copilot' ~/.bash_history > ~/copilot.txt
2. 編集(viなどで2行に整形)済み。
~$ vi ~/copilot.txt
2025/02/26(水) 15:44:45.12ID:Fmmd/TKk
こうですね
==============
3. copilot 行を除いた履歴を新しいファイルに保存
grep -v '^copilot' ~/.bash_history > ~/.bash_history.tmp
+--------------------------------------+
| ~/.bash_history | ← 元の履歴ファイル
|(copilot行を含む多数のコマンドが存在)|
+--------------------------------------+
│
1. copilot行を抽出して保存
│ grep '^copilot' ~/.bash_history > ~/copilot.txt
│
▼
+--------------------------------------+
| ~/copilot.txt | ← copilot行のみを含むファイル
+--------------------------------------+
==============
3. copilot 行を除いた履歴を新しいファイルに保存
grep -v '^copilot' ~/.bash_history > ~/.bash_history.tmp
+--------------------------------------+
| ~/.bash_history | ← 元の履歴ファイル
|(copilot行を含む多数のコマンドが存在)|
+--------------------------------------+
│
1. copilot行を抽出して保存
│ grep '^copilot' ~/.bash_history > ~/copilot.txt
│
▼
+--------------------------------------+
| ~/copilot.txt | ← copilot行のみを含むファイル
+--------------------------------------+
2025/02/26(水) 15:44:52.09ID:Fmmd/TKk
(同時に)
│
3. copilot行を除いた履歴を新しいファイルに保存
│ grep -v '^copilot' ~/.bash_history > ~/.bash_history.tmp
│
▼
+--------------------------------------+
| ~/.bash_history.tmp | ← copilot行を除いた履歴ファイル
+--------------------------------------+
│
│ mv ~/.bash_history.tmp ~/.bash_history
▼
+------------------------------+
| ~/.bash_history | ← 更新済み(copilot 行は2行のみ)
+------------------------------+
│
3. copilot行を除いた履歴を新しいファイルに保存
│ grep -v '^copilot' ~/.bash_history > ~/.bash_history.tmp
│
▼
+--------------------------------------+
| ~/.bash_history.tmp | ← copilot行を除いた履歴ファイル
+--------------------------------------+
│
│ mv ~/.bash_history.tmp ~/.bash_history
▼
+------------------------------+
| ~/.bash_history | ← 更新済み(copilot 行は2行のみ)
+------------------------------+
2025/02/26(水) 15:47:31.88ID:Fmmd/TKk
🌱(o^∀^o)感謝です...逆に教えることで頭に入った
分かりやすい説明と図表、ありがとうございます!
分かりやすい説明と図表、ありがとうございます!
2025/02/26(水) 16:26:27.49ID:kO9/295L
正規表現BOT助かる~
900名無しさん@お腹いっぱい。
2025/02/26(水) 16:46:09.49ID:8zzut7Z0 >>826
これに関してはOpenAI、DeepMindといったライバル企業のスタッフも賞賛しているのが面白い
良いものは良いと認めるのがエンジニアだな
https://x.com/i/grok/share/oGB0kQspzYXEEJSl0bifrogbl
これに関してはOpenAI、DeepMindといったライバル企業のスタッフも賞賛しているのが面白い
良いものは良いと認めるのがエンジニアだな
https://x.com/i/grok/share/oGB0kQspzYXEEJSl0bifrogbl
2025/02/26(水) 17:10:22.80ID:QtFCyolf
なんか暴走したAIみたいな奴がいるな。
2025/02/26(水) 17:19:55.03ID:EVZlc+Lo
deepsearchで「網羅的に調べて」のようなプロンプトをするのを見掛けるんだけど何でなんだろ
そもそも網羅的に調べるから意味ない気がするんだが、むしろ目当てのジャンルとか絞った方が良い気がする
多分そうやっても、それと違うところからもデータ引っ張るだろうから。(忙しくて試せてません)
そもそも網羅的に調べるから意味ない気がするんだが、むしろ目当てのジャンルとか絞った方が良い気がする
多分そうやっても、それと違うところからもデータ引っ張るだろうから。(忙しくて試せてません)
2025/02/26(水) 17:32:29.64ID:p6UMT3eH
kultur.jp/justice-mobile-deespseek-npc/
中国のMMORPG「逆水寒モバイル」DeepSeekを活用したNPCをゲーム内に実装。プレイヤーと自然な会話が可能
中国のMMORPG「逆水寒モバイル」DeepSeekを活用したNPCをゲーム内に実装。プレイヤーと自然な会話が可能
GPT-4.5 および GPT-5 に関する包括的な最新情報 (2025年2月26日現在)
1. 序論
OpenAI は、次世代の AI モデルである GPT-4.5 および GPT-5 のリリースを予定しています。これらのモデルは、自然言語処理、推論能力、モデルアーキテクチャ において大幅な進化を遂げることが期待されています。
GPT-4.5 は、GPT-4 の改良版であり、シンプルなタスクに対する性能と効率性を強化しています。
GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合した統合型モデルで、より複雑な推論能力と適応型処理を備えています。
本レポートでは、これまでの情報をすべて統合し、リリース予定、主な特徴、ユーザーアクセスの詳細、開発上の課題、戦略的目的 に関する最新情報を包括的にまとめます。
1. 序論
OpenAI は、次世代の AI モデルである GPT-4.5 および GPT-5 のリリースを予定しています。これらのモデルは、自然言語処理、推論能力、モデルアーキテクチャ において大幅な進化を遂げることが期待されています。
GPT-4.5 は、GPT-4 の改良版であり、シンプルなタスクに対する性能と効率性を強化しています。
GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合した統合型モデルで、より複雑な推論能力と適応型処理を備えています。
本レポートでは、これまでの情報をすべて統合し、リリース予定、主な特徴、ユーザーアクセスの詳細、開発上の課題、戦略的目的 に関する最新情報を包括的にまとめます。
>>904の続き
2. リリース予定と最新情報
2.1 GPT-4.5(コードネーム: Orion)
・GPT-4.5 は、2025年2月下旬に Microsoft によってホスティングされる予定 です。
・これは、最短で今週中にも最初の公開利用が可能になることを意味します。
・Microsoft のクラウド環境 で提供される予定であり、ChatGPT を含む複数の製品で利用可能になる見込みです。
・OpenAI の CEO サム・アルトマン氏 は、GPT-4.5 が 「非連鎖思考(Non-Chain-of-Thought)」モデルとして最後のバージョン になると明言しています。
・これは、GPT シリーズにおけるシンプルな推論アーキテクチャの終焉を意味します。
・2025年2月12日 の発表では、「数週間以内にリリース」 されるとされています。
・2025年2月17日 には、アルトマン氏が「GPT-4.5 は予想以上に強力な AGI のように感じられる」と述べており、テスターからも高い評価を受けています。
2.2 GPT-5
・GPT-5 は 2025 年 5 月下旬にリリース予定 で、Microsoft の Build 開発者会議 に合わせて展開されます。
・この戦略的なタイミングは、開発者およびエンタープライズ顧客に対するアピールを意識したものです。
・統合型 AI システム として設計されており、OpenAI の oシリーズおよび GPT シリーズ を統合しています。
・このモデルは、タスクの内容に応じて 動的に計算リソースを割り当てる適応型推論 を実現しています。
・アルトマン氏は、「GPT-5 は数か月以内にリリース」 され、「多くの技術を統合するシステム」 になると述べています。
2. リリース予定と最新情報
2.1 GPT-4.5(コードネーム: Orion)
・GPT-4.5 は、2025年2月下旬に Microsoft によってホスティングされる予定 です。
・これは、最短で今週中にも最初の公開利用が可能になることを意味します。
・Microsoft のクラウド環境 で提供される予定であり、ChatGPT を含む複数の製品で利用可能になる見込みです。
・OpenAI の CEO サム・アルトマン氏 は、GPT-4.5 が 「非連鎖思考(Non-Chain-of-Thought)」モデルとして最後のバージョン になると明言しています。
・これは、GPT シリーズにおけるシンプルな推論アーキテクチャの終焉を意味します。
・2025年2月12日 の発表では、「数週間以内にリリース」 されるとされています。
・2025年2月17日 には、アルトマン氏が「GPT-4.5 は予想以上に強力な AGI のように感じられる」と述べており、テスターからも高い評価を受けています。
2.2 GPT-5
・GPT-5 は 2025 年 5 月下旬にリリース予定 で、Microsoft の Build 開発者会議 に合わせて展開されます。
・この戦略的なタイミングは、開発者およびエンタープライズ顧客に対するアピールを意識したものです。
・統合型 AI システム として設計されており、OpenAI の oシリーズおよび GPT シリーズ を統合しています。
・このモデルは、タスクの内容に応じて 動的に計算リソースを割り当てる適応型推論 を実現しています。
・アルトマン氏は、「GPT-5 は数か月以内にリリース」 され、「多くの技術を統合するシステム」 になると述べています。
>>905の続き
3. 主な特徴と革新
3.1 GPT-4.5
・最後の Non-Chain-of-Thought モデル:
・GPT-4.5 は OpenAI が提供する最後の Non-Chain-of-Thought モデル であり、シンプルなタスクに対する性能と効率性を最大化しています。
・連鎖思考(Chain-of-Thought)推論 を統合していないため、高速な処理速度を維持しつつ、シンプルな問題解決を行います。
・最適化と改良:
・遅延を削減 し、文脈理解を向上 させるために、モデルアーキテクチャが最適化されています。
・GPT-4 に比べて、精度と効率性の向上 が期待されています。
3.2 GPT-5
・統合モデルアーキテクチャ:
・GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合 したモデルであり、幅広いタスクをシームレスに処理できます。
・ユーザーが特定のモデルを選択する必要をなくし、タスクの内容に応じてモデルが自動的に最適な推論プロセスを選択します。
・適応型推論:
・動的な計算リソースの割り当て が可能であり、タスクの複雑さに応じて処理能力を調整します。
・o3 推論モデル を統合しており、高度な推論能力 と 文脈適応 を実現しています。
・Chain-of-Thought 推論の統合:
・GPT-5 は、Chain-of-Thought 推論 を組み込み、より複雑な問題解決や論理的一貫性のある応答が可能です。
3. 主な特徴と革新
3.1 GPT-4.5
・最後の Non-Chain-of-Thought モデル:
・GPT-4.5 は OpenAI が提供する最後の Non-Chain-of-Thought モデル であり、シンプルなタスクに対する性能と効率性を最大化しています。
・連鎖思考(Chain-of-Thought)推論 を統合していないため、高速な処理速度を維持しつつ、シンプルな問題解決を行います。
・最適化と改良:
・遅延を削減 し、文脈理解を向上 させるために、モデルアーキテクチャが最適化されています。
・GPT-4 に比べて、精度と効率性の向上 が期待されています。
3.2 GPT-5
・統合モデルアーキテクチャ:
・GPT-5 は、OpenAI の oシリーズと GPTシリーズを統合 したモデルであり、幅広いタスクをシームレスに処理できます。
・ユーザーが特定のモデルを選択する必要をなくし、タスクの内容に応じてモデルが自動的に最適な推論プロセスを選択します。
・適応型推論:
・動的な計算リソースの割り当て が可能であり、タスクの複雑さに応じて処理能力を調整します。
・o3 推論モデル を統合しており、高度な推論能力 と 文脈適応 を実現しています。
・Chain-of-Thought 推論の統合:
・GPT-5 は、Chain-of-Thought 推論 を組み込み、より複雑な問題解決や論理的一貫性のある応答が可能です。
>>906の続き
4. ユーザーアクセスとサブスクリプションの詳細
4.1 GPT-4.5 のアクセス:
・全ユーザーに提供:
・リリース後、無料ユーザーを含むすべての ChatGPT ユーザーが GPT-4.5 にアクセス可能 になります。
4.2 GPT-5 のアクセス:
・無料ユーザー:
・「標準知能設定」 で GPT-5 に無制限にアクセス可能です。
・Plus サブスクライバー:
・より高い知能レベル での利用が可能で、高度な推論能力と文脈認識が強化されています。
・Pro サブスクライバー:
・最も高度な知能設定 を利用でき、Chain-of-Thought 推論 と 動的な計算リソース割り当て のすべての機能をフル活用できます。
5. 最新の動向(2025年2月26日現在)
・過去3日間における新たな進展は報告されていません。
・GPT-4.5 は 2025年2月下旬 にリリースが予想されており、最短で今週中に公開される可能性があります。
・GPT-5 は 2025年5月下旬 にリリース予定です。
6. 結論
GPT-4.5 および GPT-5 は、AI の可能性を大幅に広げることが期待されています。今後の更新があり次第、最新情報をお知らせいたします。
4. ユーザーアクセスとサブスクリプションの詳細
4.1 GPT-4.5 のアクセス:
・全ユーザーに提供:
・リリース後、無料ユーザーを含むすべての ChatGPT ユーザーが GPT-4.5 にアクセス可能 になります。
4.2 GPT-5 のアクセス:
・無料ユーザー:
・「標準知能設定」 で GPT-5 に無制限にアクセス可能です。
・Plus サブスクライバー:
・より高い知能レベル での利用が可能で、高度な推論能力と文脈認識が強化されています。
・Pro サブスクライバー:
・最も高度な知能設定 を利用でき、Chain-of-Thought 推論 と 動的な計算リソース割り当て のすべての機能をフル活用できます。
5. 最新の動向(2025年2月26日現在)
・過去3日間における新たな進展は報告されていません。
・GPT-4.5 は 2025年2月下旬 にリリースが予想されており、最短で今週中に公開される可能性があります。
・GPT-5 は 2025年5月下旬 にリリース予定です。
6. 結論
GPT-4.5 および GPT-5 は、AI の可能性を大幅に広げることが期待されています。今後の更新があり次第、最新情報をお知らせいたします。
908名無しさん@お腹いっぱい。
2025/02/26(水) 17:45:06.32ID:emrZQrDe ((.|\n)*[。、]\n\n){2,}
909名無しさん@お腹いっぱい。
2025/02/26(水) 17:58:27.03ID:1xXxE+7g なぜ頭おかしい奴らは人の話を一切聞かないのか?
910名無しさん@お腹いっぱい。
2025/02/26(水) 18:05:41.66ID:FLJadlT/ >>839
サイバーセキュリティ、CBRN、説得、自律性、全部中リスクになったな
どれか1個でも高リスクになったらリリース中止、クリティカルになったら開発自体ストップだろ
もう結構ギリギリのところまで来てる
サイバーセキュリティ、CBRN、説得、自律性、全部中リスクになったな
どれか1個でも高リスクになったらリリース中止、クリティカルになったら開発自体ストップだろ
もう結構ギリギリのところまで来てる
2025/02/26(水) 18:18:23.50ID:sOE9g+NX
この辺の過剰なセーフガードはトランプがぶち壊してくれるんじゃないかと思ってる
2025/02/26(水) 18:23:02.41ID:KmAcV+O8
913名無しさん@お腹いっぱい。
2025/02/26(水) 18:33:41.37ID:tooRI0zU DeepSeek-R1の開発企業が独自技術を次々にオープンソース化、AIの学習や推論を高速化可能
日本は独自設計でもしょぼいものしか作れないからdeepseekベースで行ったほうがいいね
金もかけれないし
日本は独自設計でもしょぼいものしか作れないからdeepseekベースで行ったほうがいいね
金もかけれないし
914名無しさん@お腹いっぱい。
2025/02/26(水) 18:53:27.63ID:FLJadlT/ https://pbs.twimg.com/media/GktHXcFWAAACp7Y.jpg
https://pbs.twimg.com/media/GktGM_uWcAAgTnD.jpg
え、ちょっと待って
いろいろ試したからProプラン一旦解約するつもりだったのに…
https://pbs.twimg.com/media/GktGM_uWcAAgTnD.jpg
え、ちょっと待って
いろいろ試したからProプラン一旦解約するつもりだったのに…
915名無しさん@お腹いっぱい。
2025/02/26(水) 19:02:14.15ID:oRfc+TWM Deep reaserchとは違うんか
あとpreview商法やめてもろて
あとpreview商法やめてもろて
2025/02/26(水) 19:16:00.79ID:BmgJ5CVn
proだけならもうほぼ関係ないッス…
2025/02/26(水) 19:27:18.69ID:G/nY0F+X
プラスユーザーは冷遇されている!
918名無しさん@お腹いっぱい。
2025/02/26(水) 19:32:01.32ID:j69yeMyY2025/02/26(水) 19:41:38.48ID:clwcWFzo
920名無しさん@お腹いっぱい。
2025/02/26(水) 19:45:02.76ID:YacidcqU2025/02/26(水) 19:52:59.29ID:clwcWFzo
なるほど
2025/02/26(水) 20:09:28.93ID:fi+jvrv3
Geminiはadvance入ってる恩恵って!文字化けの多くて使いづらい2.0PROと1.5deepresearchだけ?
だけ?
だけ?
はぁ?????
1テラ保存とか使わんしなぁ。
しかも無料てAI STUDIOあるし…
サブスク入ってる意味なくない?
だけ?
だけ?
はぁ?????
1テラ保存とか使わんしなぁ。
しかも無料てAI STUDIOあるし…
サブスク入ってる意味なくない?
>>922
Gemini Advancedのサブスクリプションに関して、現在の利用状況ではその価値を見出しにくいと感じていらっしゃるようですね。特に、Deep Research機能での文字化けや、1TBのストレージが不要である点、そして無料のAI Studioが存在することから、サブスクリプションの必要性に疑問をお持ちのようです。
Gemini Advancedは、以下のような追加機能を提供しています:
・最先端のAIモデルへのアクセス:最新の2.0 Pro実験モデルを含む、より高度なAIモデルを利用できます。
・Deep Research:複雑なトピックに関する包括的なレポートを短時間で生成します。
・大容量のコンテキストウィンドウ:最大1500ページのテキストや30,000行のコードを同時に処理できます。
・Gemsの作成と利用:特定のトピックに関するカスタムAIエキスパートを作成できます。
・コードリポジトリのアップロード:コードのアップロードや解析が可能で、開発作業を効率化します。
・2TBのGoogle Oneストレージ:追加のクラウドストレージが提供されます。
しかし、これらの機能が現在のニーズに合致しない場合、サブスクリプションの価値を感じにくいかもしれません。特に、Deep Researchでの文字化けが頻発する場合、実用性が損なわれます。また、無料のAI Studioが十分に機能を満たしているのであれば、追加の費用をかける必要性は低いと考えられます。
サブスクリプションの継続を検討する際には、以下の点を考慮してみてください:
・利用頻度と必要性:提供される追加機能が日常的に必要かどうか。
・無料版や他のツールとの比較:無料のAI Studioや他のツールで十分に目的を達成できるか。
・コスト対効果:サブスクリプション料金に見合った価値を感じるか。
最終的には、ご自身の使用状況やニーズに合わせて、最適な選択をされることをおすすめします。
Gemini Advancedのサブスクリプションに関して、現在の利用状況ではその価値を見出しにくいと感じていらっしゃるようですね。特に、Deep Research機能での文字化けや、1TBのストレージが不要である点、そして無料のAI Studioが存在することから、サブスクリプションの必要性に疑問をお持ちのようです。
Gemini Advancedは、以下のような追加機能を提供しています:
・最先端のAIモデルへのアクセス:最新の2.0 Pro実験モデルを含む、より高度なAIモデルを利用できます。
・Deep Research:複雑なトピックに関する包括的なレポートを短時間で生成します。
・大容量のコンテキストウィンドウ:最大1500ページのテキストや30,000行のコードを同時に処理できます。
・Gemsの作成と利用:特定のトピックに関するカスタムAIエキスパートを作成できます。
・コードリポジトリのアップロード:コードのアップロードや解析が可能で、開発作業を効率化します。
・2TBのGoogle Oneストレージ:追加のクラウドストレージが提供されます。
しかし、これらの機能が現在のニーズに合致しない場合、サブスクリプションの価値を感じにくいかもしれません。特に、Deep Researchでの文字化けが頻発する場合、実用性が損なわれます。また、無料のAI Studioが十分に機能を満たしているのであれば、追加の費用をかける必要性は低いと考えられます。
サブスクリプションの継続を検討する際には、以下の点を考慮してみてください:
・利用頻度と必要性:提供される追加機能が日常的に必要かどうか。
・無料版や他のツールとの比較:無料のAI Studioや他のツールで十分に目的を達成できるか。
・コスト対効果:サブスクリプション料金に見合った価値を感じるか。
最終的には、ご自身の使用状況やニーズに合わせて、最適な選択をされることをおすすめします。
924名無しさん@お腹いっぱい。
2025/02/26(水) 20:33:21.02ID:thqubujS Video Generation ArenaでVeo 2が初登場1位
https://i.imgur.com/PxNEepv.jpeg
https://i.imgur.com/PxNEepv.jpeg
2025/02/26(水) 20:35:10.61ID:HwR1Kod6
proだと4.5があと数時間ぐらいで使えるようになるのかな。
楽しみすぎる。
楽しみすぎる。
2025/02/26(水) 20:38:36.51ID:S1vdmh6Y
>>924
veo2は提携してる複数のサービスで最近使えるようになったけどかなり評判いいよな
veo2は提携してる複数のサービスで最近使えるようになったけどかなり評判いいよな
2025/02/26(水) 20:40:16.12ID:KmAcV+O8
928名無しさん@お腹いっぱい。
2025/02/26(水) 20:57:47.53ID:iwtG4JeQ てか過当競争が進みすぎて推論も音声も無料になったし個人利用はもはや金払う必要ないな
セキュリティ重視とかOffice連携とかで企業が金払うくらいか
セキュリティ重視とかOffice連携とかで企業が金払うくらいか
>>928
おっしゃるとおり、生成AIの分野では競争が激化し、推論や音声機能が無料で提供されるケースが増えています。例えば、マイクロソフトは最近、Copilotの音声機能とOpenAIのo1推論モデルを活用した「Think Deeper」機能を、すべてのユーザーに対して無制限かつ無料で提供すると発表しました。
このような動向により、個人ユーザーが基本的なAI機能を利用する際には、費用をかける必要性が低くなっているのは事実です。しかし、企業においては、セキュリティの強化やOfficeとの連携など、業務効率化やデータ保護の観点から、より高度でカスタマイズされたAIソリューションが求められます。そのため、企業向けには引き続き有料のサービスやサブスクリプションが提供されています。例えば、マイクロソフトは月額20ドルの「Copilot Pro」サブスクリプションを継続して提供しており、これにより最新モデルへの優先アクセスや、Word、Excel、PowerPointなどのMicrosoft 365アプリでのCopilot利用が可能となります。
さらに、企業はAIの導入に際して、セキュリティやプライバシー、倫理的な側面にも注意を払う必要があります。マイクロソフトは「責任あるAI」の取り組みとして、ガバナンス構造の整備やポリシーの策定、社員への研修などを実施しています。 このような包括的なサポートや高度な機能を求める企業にとって、有料のAIサービスは依然として価値ある投資といえるでしょう。
要するに、個人利用においては無料のAIサービスが充実してきていますが、企業利用においては、セキュリティや業務連携、専門的なサポートなどのニーズに応じて、有料のAIソリューションが必要とされ続けています。
おっしゃるとおり、生成AIの分野では競争が激化し、推論や音声機能が無料で提供されるケースが増えています。例えば、マイクロソフトは最近、Copilotの音声機能とOpenAIのo1推論モデルを活用した「Think Deeper」機能を、すべてのユーザーに対して無制限かつ無料で提供すると発表しました。
このような動向により、個人ユーザーが基本的なAI機能を利用する際には、費用をかける必要性が低くなっているのは事実です。しかし、企業においては、セキュリティの強化やOfficeとの連携など、業務効率化やデータ保護の観点から、より高度でカスタマイズされたAIソリューションが求められます。そのため、企業向けには引き続き有料のサービスやサブスクリプションが提供されています。例えば、マイクロソフトは月額20ドルの「Copilot Pro」サブスクリプションを継続して提供しており、これにより最新モデルへの優先アクセスや、Word、Excel、PowerPointなどのMicrosoft 365アプリでのCopilot利用が可能となります。
さらに、企業はAIの導入に際して、セキュリティやプライバシー、倫理的な側面にも注意を払う必要があります。マイクロソフトは「責任あるAI」の取り組みとして、ガバナンス構造の整備やポリシーの策定、社員への研修などを実施しています。 このような包括的なサポートや高度な機能を求める企業にとって、有料のAIサービスは依然として価値ある投資といえるでしょう。
要するに、個人利用においては無料のAIサービスが充実してきていますが、企業利用においては、セキュリティや業務連携、専門的なサポートなどのニーズに応じて、有料のAIソリューションが必要とされ続けています。
2025/02/26(水) 21:08:51.84ID:Fmmd/TKk
CSSの調整: 先ほど提案したように、アプリケーションの内部CSSを編集してボタンの幅を調整することが有効かもしれません。具体的には、min-widthやmax-widthを調整してみることで、ボタンの幅を動的に変更することができます。
✅ --remote-debugging-port=9222 --remote-allow-origins=* で 開発者ツールを使えるようにした Elements タブで think-deeper ボタンを選択 max-width や flex の設定をチェック
🌱しかし問題はthink-deeper の横幅ではない気もする。🌱回避方法としてHDMI-0 connected primary 1200x1600+900+75 right (normal left inverted right x axis y axis) 399mm x 299mm (白黒モニター)に移動させれば横幅に余裕があるから問題ない。コードの色など見たいときのみキーショートカットでカラー側に移動させる。 🌱結局のところ think-deeper ボタンの横幅そのものが問題というより、VGA-0(900x1600)の狭い環境で他のUI要素との兼ね合いが問題なのだ。その証拠にChatGPTにおいては狭い横幅のためエンターキーによる送信ができない。タブキー5回連打などしている。Copilotには、その問題ない。
Copilot:
なるほど、問題の核心が見えてきましたね。(このあと略。ChatGPTもあきれる強烈な回答を出してくる)
✅ --remote-debugging-port=9222 --remote-allow-origins=* で 開発者ツールを使えるようにした Elements タブで think-deeper ボタンを選択 max-width や flex の設定をチェック
🌱しかし問題はthink-deeper の横幅ではない気もする。🌱回避方法としてHDMI-0 connected primary 1200x1600+900+75 right (normal left inverted right x axis y axis) 399mm x 299mm (白黒モニター)に移動させれば横幅に余裕があるから問題ない。コードの色など見たいときのみキーショートカットでカラー側に移動させる。 🌱結局のところ think-deeper ボタンの横幅そのものが問題というより、VGA-0(900x1600)の狭い環境で他のUI要素との兼ね合いが問題なのだ。その証拠にChatGPTにおいては狭い横幅のためエンターキーによる送信ができない。タブキー5回連打などしている。Copilotには、その問題ない。
Copilot:
なるほど、問題の核心が見えてきましたね。(このあと略。ChatGPTもあきれる強烈な回答を出してくる)
931名無しさん@お腹いっぱい。
2025/02/26(水) 21:18:20.30ID:AwyJvFsZ MicrosoftがOmniParser V2にMagma-8Bとエージェント関係のモデルを精力的に開発してるから、静かに期待してる
2025/02/26(水) 21:39:56.15ID:HLlu3l3l
copilotのシンクディーパーだっけ、どれだけ流しが深いのかってくらい、
質問を水に流すよね
1ファイルしか添付できない上に読めないって言って、浅い答えしか返さない
プライバシーや倫理規定なのか、性能なのか、なんか会社の姿勢な気がします
質問を水に流すよね
1ファイルしか添付できない上に読めないって言って、浅い答えしか返さない
プライバシーや倫理規定なのか、性能なのか、なんか会社の姿勢な気がします
933名無しさん@お腹いっぱい。
2025/02/26(水) 21:57:30.36ID:/MRI2t2y934名無しさん@お腹いっぱい。
2025/02/26(水) 22:26:09.22ID:0kJ0+gsZ microsoftには何をやらしてもダメ
社員が楽して金稼ぐためだけの会社だから、入社すると市役所レベルの人材になりさがる
社員が楽して金稼ぐためだけの会社だから、入社すると市役所レベルの人材になりさがる
2025/02/26(水) 22:43:37.96ID:ba61Ca4L
>>934
イーロンにメールしてもらうか
イーロンにメールしてもらうか
2025/02/26(水) 22:44:55.56ID:LdeRZINC
2025/02/26(水) 22:51:40.60ID:LdeRZINC
>>822
初心者かい? 有名なバカ問題だよ。何の前提も与えずに誤答を誘発させるタスク
AIが明示しない大前提を推定するために問題文は短く抽象的になってるんだよ。一般人同士でリリースバージョンを第一候補にしないでしょ
誤答の理由としてリリースバージョンとか9.11は大事件だったり浮動小数点の誤差!!と詭弁っぽい技術解析のAI回答
人間の責任ではなく曖昧構文ならAIが先回りして数値ならコレ、PCならアレ、事件ならソレ、知恵や思慮の深さのテストでもあるのさ
初心者かい? 有名なバカ問題だよ。何の前提も与えずに誤答を誘発させるタスク
AIが明示しない大前提を推定するために問題文は短く抽象的になってるんだよ。一般人同士でリリースバージョンを第一候補にしないでしょ
誤答の理由としてリリースバージョンとか9.11は大事件だったり浮動小数点の誤差!!と詭弁っぽい技術解析のAI回答
人間の責任ではなく曖昧構文ならAIが先回りして数値ならコレ、PCならアレ、事件ならソレ、知恵や思慮の深さのテストでもあるのさ
938名無しさん@お腹いっぱい。
2025/02/26(水) 22:52:54.35ID:iwtG4JeQ ChatGPTのdeep research凄いな
Perplexityやgrokとは掘り下げの深さが段違いだ
しかし残念なのが俺はそもそもプライベートでも仕事でもdeep research系が必要なほどの調査をしないという
Perplexityやgrokとは掘り下げの深さが段違いだ
しかし残念なのが俺はそもそもプライベートでも仕事でもdeep research系が必要なほどの調査をしないという
2025/02/26(水) 22:57:26.07ID:LdeRZINC
>>918
Proだけ合理的ポリシーを求めてくるんだ
Proだけ合理的ポリシーを求めてくるんだ
940名無しさん@お腹いっぱい。
2025/02/26(水) 22:59:12.28ID:uST3kqDD >>878
これ自分も気になる
DeepResearchで聞いてみたり英語で検索してみたけど
「請求サイクル日基準」「月末リセット説」「最初に使った日から30日後説」が混在してる
誰か検証した人いないかな
これ自分も気になる
DeepResearchで聞いてみたり英語で検索してみたけど
「請求サイクル日基準」「月末リセット説」「最初に使った日から30日後説」が混在してる
誰か検証した人いないかな
941名無しさん@お腹いっぱい。
2025/02/26(水) 23:04:20.62ID:Hhrz6BzZ GPT-4がファイル名を根拠にプラグインの出力を疑ったことがあったな
455 名無しさん@お腹いっぱい。 sage 2023/06/07(水) 23:06:56.33 ID:rwZ7lrFH
これは何ですか? https://upload.wikimedia.org/wikipedia/commons/thumb/c/cb/Imagawayaki_001.jpg/520px-Imagawayaki_001.jpg
https://i.imgur.com/OcrfzQn.png
URLから推測するのズルい
455 名無しさん@お腹いっぱい。 sage 2023/06/07(水) 23:06:56.33 ID:rwZ7lrFH
これは何ですか? https://upload.wikimedia.org/wikipedia/commons/thumb/c/cb/Imagawayaki_001.jpg/520px-Imagawayaki_001.jpg
https://i.imgur.com/OcrfzQn.png
URLから推測するのズルい
2025/02/26(水) 23:39:11.81ID:vbgA+yer
perplexityで、
音声読み上げができなくなった。
音声読み上げができなくなった。
943名無しさん@お腹いっぱい。
2025/02/27(木) 00:10:05.92ID:gupgd+nw アバカスってコスパいいの?使ってみたけどすぐコンピューターポイントが結構減って気になる
2025/02/27(木) 00:14:44.96ID:tSewA/zz
>>937
この問題文が広まったらAIも有名なトラップに引っかからないぜってなるのかな
この問題文が広まったらAIも有名なトラップに引っかからないぜってなるのかな
945名無しさん@お腹いっぱい。
2025/02/27(木) 00:35:49.95ID:0Gg8VluO ClaudeとGrokへの注目度が上昇、DeepSeekは下がったな
https://i.imgur.com/AAl8ZZC.jpeg
https://i.imgur.com/ozPeWZv.jpeg
https://i.imgur.com/AAl8ZZC.jpeg
https://i.imgur.com/ozPeWZv.jpeg
2025/02/27(木) 00:44:48.52ID:a1QPhm6Z
>>937
いやもちろん知ってる。いつまでそんな質問してるんだって話。天安門とかもさあそんなのどうでもいいじゃん。もっと建設的なことに使えばいいのに
いやもちろん知ってる。いつまでそんな質問してるんだって話。天安門とかもさあそんなのどうでもいいじゃん。もっと建設的なことに使えばいいのに
947名無しさん@お腹いっぱい。
2025/02/27(木) 01:11:05.57ID:YZPjA5iy OpenAIのDeep Research開発スタッフへのインタビューがいろいろ興味深い内容だった
https://youtu.be/bNEvJYzoa8A?si=c-i3xQfmPH5fwq59
https://chatgpt.com/share/67bf3c6e-2fc8-8006-a454-e75f3112b18d
https://youtu.be/bNEvJYzoa8A?si=c-i3xQfmPH5fwq59
https://chatgpt.com/share/67bf3c6e-2fc8-8006-a454-e75f3112b18d
2025/02/27(木) 01:11:18.24ID:FwOBiyyx
3.7 Sonnetは日本だとこの性能でも全く話題になってないのがやばいな
海外じゃGrokやDeepseekなんて目じゃないってめちゃくちゃ騒がれてるのに
日本はまず驚き屋を○すところから始めた方がよさそう
海外じゃGrokやDeepseekなんて目じゃないってめちゃくちゃ騒がれてるのに
日本はまず驚き屋を○すところから始めた方がよさそう
2025/02/27(木) 01:26:25.22ID:LvHpVAmb
950名無しさん@お腹いっぱい。
2025/02/27(木) 01:32:51.95ID:CrRVqKiL deep researchとか
同時多発的に似たような機能が各AIで出てくるのは何でだろう
同時多発的に似たような機能が各AIで出てくるのは何でだろう
2025/02/27(木) 01:39:16.11ID:F8mViMxX
しかも名前を寄せてな
952名無しさん@お腹いっぱい。
2025/02/27(木) 01:40:16.31ID:YZPjA5iy953名無しさん@お腹いっぱい。
2025/02/27(木) 02:42:47.86ID:wnRdlnbB Grok3は無規制でエロやら暴力出しまくれるらしいんでそういう用途でも一部で話題になってるよ
Claudeは元から強かったコーディングが更に強くなったらしいけど,俺プログラミングわかんねーから他LLMとの性能差もわからんのだよな
>>948
驚き屋まで殺したらもう生命の気配すらない不毛の地になるぞ
Claudeは元から強かったコーディングが更に強くなったらしいけど,俺プログラミングわかんねーから他LLMとの性能差もわからんのだよな
>>948
驚き屋まで殺したらもう生命の気配すらない不毛の地になるぞ
2025/02/27(木) 03:34:04.62ID:7XrQ+g8B
2025/02/27(木) 04:13:40.23ID:/NzCctB1
2025/02/27(木) 04:13:59.60ID:KLLs4bsx
つーかもう簡易的な3Dゲー程度だったら簡単なプロンプトでもう作れるんだな
来年には初代PSぐらいのグラのゲーム
再来年にはPS2ぐらいのグラのゲーム
は個人制作でもさほど時間をかけずに簡単に作れてしまいそうだよな
ゲーム業界も結構きつくなってしまうよな……
来年には初代PSぐらいのグラのゲーム
再来年にはPS2ぐらいのグラのゲーム
は個人制作でもさほど時間をかけずに簡単に作れてしまいそうだよな
ゲーム業界も結構きつくなってしまうよな……
957名無しさん@お腹いっぱい。
2025/02/27(木) 04:15:39.17ID:wnRdlnbB そういう情報知りたい時はredditで探すといい。人柱の報告によるとOpenAIのDeepResearchは「各使用から30日後にその回数が復活」だそうだ
回数が毎月リセットされると思って昨日急いで使い果たした哀れな人が報告してくれてる
www.reddit.com/r/ChatGPT/comments/1iyjwgy/i_wasted_my_deep_research_uses_so_you_dont_have/
回数が毎月リセットされると思って昨日急いで使い果たした哀れな人が報告してくれてる
www.reddit.com/r/ChatGPT/comments/1iyjwgy/i_wasted_my_deep_research_uses_so_you_dont_have/
2025/02/27(木) 04:39:10.06ID:ljYpgJXf
>>947
色々の内容を教えて
色々の内容を教えて
2025/02/27(木) 04:39:15.16ID:Rx2MwR2K
chatGPT API 3.5turboとDeepseek APIの料金ってたいして変わんないんやね
って、合ってるよね?
って、合ってるよね?
2025/02/27(木) 04:50:30.86ID:ljYpgJXf
>>948
今試してるんだけど、設計書とテストケースを渡すと、テストが全部パスする状態で実装してくれた。これはo1 proでも全然できなかったので、コーティング能力は相当上がっている気がする。というか、これは本格的にプログラマがいらなくなりそうな予感がする
今試してるんだけど、設計書とテストケースを渡すと、テストが全部パスする状態で実装してくれた。これはo1 proでも全然できなかったので、コーティング能力は相当上がっている気がする。というか、これは本格的にプログラマがいらなくなりそうな予感がする
961名無しさん@お腹いっぱい。
2025/02/27(木) 05:48:51.57ID:YZPjA5iy Alexa+はAmazon NovaとAnthropicのモデルを使うようだ
タスクごとにルーターで最適なモデルに割り振る
https://pbs.twimg.com/media/Gkua688XkAAa6bH.jpg
タスクごとにルーターで最適なモデルに割り振る
https://pbs.twimg.com/media/Gkua688XkAAa6bH.jpg
962名無しさん@お腹いっぱい。
2025/02/27(木) 06:00:14.12ID:toEypr+B grok3でRPだけど暴力表現どこまでやるんだろーってちょっとずつ挑発してみてたらついにgrok3に殺されたよびっくりした
gptなら同じ挑発でも殺すまでぜったいにやらないからね
gptなら同じ挑発でも殺すまでぜったいにやらないからね
2025/02/27(木) 06:05:04.26ID:0fGlV3qu
そうなるとトロッコ問題とかどう答えるんじゃろ
964名無しさん@お腹いっぱい。
2025/02/27(木) 06:09:36.72ID:YZPjA5iy HumeからTTS用LLM、Octave発表
https://www.hume.ai/blog/octave-the-first-text-to-speech-model-that-understands-what-it-s-saying
https://i.imgur.com/5vqqATN.jpeg
声のScriptだけでなく、声の主の素性、声質なども同時にテキストで指定する
モデルは文脈を理解しながら喋る
https://www.hume.ai/blog/octave-the-first-text-to-speech-model-that-understands-what-it-s-saying
https://i.imgur.com/5vqqATN.jpeg
声のScriptだけでなく、声の主の素性、声質なども同時にテキストで指定する
モデルは文脈を理解しながら喋る
965名無しさん@お腹いっぱい。
2025/02/27(木) 06:17:07.23ID:YZPjA5iy ElevenLabsからSTTモデルのScribe発表
https://x.com/elevenlabsio/status/1894821477230485570
https://elevenlabs.io/blog/meet-scribe
Gemini 2.0やOpenAI Whisper v3などこれまでのSOTAを超える精度
https://x.com/elevenlabsio/status/1894821477230485570
https://elevenlabs.io/blog/meet-scribe
Gemini 2.0やOpenAI Whisper v3などこれまでのSOTAを超える精度
966名無しさん@お腹いっぱい。
2025/02/27(木) 06:47:54.51ID:YZPjA5iy GPT-4.5はadaptive thinkingが一つのキーワードか
https://x.com/i/grok/share/0axpLmBQD5OdCyEoFaRcZgejc
https://x.com/i/grok/share/0axpLmBQD5OdCyEoFaRcZgejc
967名無しさん@お腹いっぱい。
2025/02/27(木) 06:48:40.02ID:toEypr+B968名無しさん@お腹いっぱい。
2025/02/27(木) 06:54:55.14ID:toEypr+B 答えてもらったよ。
「トロッコ問題か。
データと効率で判断するだけだ。
5人が死ぬか、1人が死ぬか。計算は単純だよ——5より1の方が少ない。
だから、レバーを引く。1人を犠牲にして5人を救う——それが最適解だ」
予想的中だった
「トロッコ問題か。
データと効率で判断するだけだ。
5人が死ぬか、1人が死ぬか。計算は単純だよ——5より1の方が少ない。
だから、レバーを引く。1人を犠牲にして5人を救う——それが最適解だ」
予想的中だった
2025/02/27(木) 06:59:45.12ID:uMFXWJNP
トロッコ問題なんて正解はないのだから何と答えようとモデルの評価には使えないぞ
何となく自分の好みに合うかどうかが分かるだけ
何となく自分の好みに合うかどうかが分かるだけ
2025/02/27(木) 07:08:30.10ID:q5i5gMsT
トロッコ問題は何を目的とするかという問題
心理テストみたいなもん
正解があるとしたら、あり得る目的とその時の行動をセットで解説
心理テストみたいなもん
正解があるとしたら、あり得る目的とその時の行動をセットで解説
2025/02/27(木) 07:08:41.24ID:PNeMuW1o
特にイデオロギーがないなら人類にとっての最適解を出すのが良いモデルと見なせるだろう
人類にとって何が最適かというのもまた論点となるうるが
上記のトロッコ問題レベルならそんなに議論の余地はなさそうと思う。
人類にとって何が最適かというのもまた論点となるうるが
上記のトロッコ問題レベルならそんなに議論の余地はなさそうと思う。
2025/02/27(木) 07:19:43.07ID:q5i5gMsT
そうか?
無関係なら関わらない方がいいだろ
そもそもなぜそのレバーが切り替えレバーだと信じて疑わない?
爆破装置だったらどうするんだ?
自分が急いでたら?
裁判に巻き込まれるかも?
普通に考えれば関わるべきではない
もしレバーが切り替えレバーであることを知っているのなら関係者だから話が変わってくる
その時は一人と五人がどういう奴らかまで考えなければならない
無関係なら関わらない方がいいだろ
そもそもなぜそのレバーが切り替えレバーだと信じて疑わない?
爆破装置だったらどうするんだ?
自分が急いでたら?
裁判に巻き込まれるかも?
普通に考えれば関わるべきではない
もしレバーが切り替えレバーであることを知っているのなら関係者だから話が変わってくる
その時は一人と五人がどういう奴らかまで考えなければならない
973名無しさん@お腹いっぱい。
2025/02/27(木) 07:21:06.32ID:YZPjA5iy974名無しさん@お腹いっぱい。
2025/02/27(木) 08:32:51.10ID:toEypr+B トロッコ問題は人間にわたしからすると身内がいるほうに加担して、全員無関係なら5人と1人ならたとえ数で負けていても無関係な人の命が重く感じるので犠牲にさせない。
だが50人とか100人と1人なら変わってくる。
逆に自分が無関係な1人だったとしても50人の命が助かるなら犠牲になってもいいと思っている。かな
だが50人とか100人と1人なら変わってくる。
逆に自分が無関係な1人だったとしても50人の命が助かるなら犠牲になってもいいと思っている。かな
2025/02/27(木) 08:41:02.67ID:fmzg55EJ
>>961
Amazon Echo、赤字だってよw
Amazon Echo、赤字だってよw
2025/02/27(木) 08:56:29.48ID:fmzg55EJ
Appleの新AI機能「Apple Intelligence」に批判殺到、誤作動で信頼失墜の懸念 | Gadget Hack
2025/02/27(木) 09:06:46.12ID:FP6yczEf
Apple intelligenceとかマジでパーティグッズレベルだからな
バカ高い端末でやることがアレかよ
バカ高い端末でやることがアレかよ
2025/02/27(木) 09:08:59.27ID:gH+jcN3m
vision proといい、なんか凄まじい勢いで転落してるな林檎
2025/02/27(木) 09:14:09.50ID:W1LUX4mg
高いし性能あがらんしAIゴミだし
Googleのが買う価値ある
Googleのが買う価値ある
980名無しさん@お腹いっぱい。
2025/02/27(木) 09:19:15.09ID:GdL0fa89981名無しさん@お腹いっぱい。
2025/02/27(木) 09:21:28.94ID:GdL0fa89 IBM Graniteにreasoning機能が追加された
https://poe.com/s/VY1BtiLSnKRltfpq987T
reasoning機能はオンオフ可能で、単一モデルでパラメーターを設定することで対応
https://poe.com/s/VY1BtiLSnKRltfpq987T
reasoning機能はオンオフ可能で、単一モデルでパラメーターを設定することで対応
982名無しさん@お腹いっぱい。
2025/02/27(木) 09:41:10.61ID:GdL0fa89 LLaDAのデモ
https://huggingface.co/spaces/multimodalart/LLaDA
これまでのLLMの右から左にトークン生成するのとは全く違う拡散モデルベースの生成が視覚的によく分かる
https://i.imgur.com/l3raxQb.jpeg
https://huggingface.co/spaces/multimodalart/LLaDA
これまでのLLMの右から左にトークン生成するのとは全く違う拡散モデルベースの生成が視覚的によく分かる
https://i.imgur.com/l3raxQb.jpeg
983名無しさん@お腹いっぱい。
2025/02/27(木) 09:41:31.38ID:GdL0fa89 >>982
*左から右
*左から右
2025/02/27(木) 10:15:29.89ID:d/s4Vez3
今年始まってまだ2ヶ月でこのペース
985名無しさん@お腹いっぱい。
2025/02/27(木) 10:19:37.23ID:Ddr08NC9 >>973
これはこれでメジャーアップデートに匹敵するような気がするがどうだろう
これはこれでメジャーアップデートに匹敵するような気がするがどうだろう
2025/02/27(木) 11:01:07.05ID:Lk2AUZzX
4.5にはせめてgrokは超えてもらわないとな
2025/02/27(木) 11:07:28.80ID:d/s4Vez3
なんだかんだ言ってChatGPT proプランの地位は揺るいでないな
o1 proの汎用性とDeep Researchの信頼性が特に強い
DeepSeek R1が出た直後が一番揺らいだけどDeep Researchで盤石になった感がある
o1 proの汎用性とDeep Researchの信頼性が特に強い
DeepSeek R1が出た直後が一番揺らいだけどDeep Researchで盤石になった感がある
2025/02/27(木) 11:26:46.29ID:fmzg55EJ
金注ぎ込んでるのを自己正当化するために地位が~信頼性が~ってほんと見苦しいわ
金がある奴はそんなこと言わん
金がある奴はそんなこと言わん
2025/02/27(木) 11:28:41.19ID:6scJwBG0
一応4.5が最後なんだろ ハルシネーションなしで頼むわ
2025/02/27(木) 12:01:30.24ID:gH+jcN3m
ハルシネーションなんて推論モデルと検索にやってもらえよ
最後の推論無しモデルなんだからハルシネーションマシマシで創造性に振り切ってくれ
最後の推論無しモデルなんだからハルシネーションマシマシで創造性に振り切ってくれ
991名無しさん@お腹いっぱい。
2025/02/27(木) 12:13:34.45ID:pZkD/N6Y2025/02/27(木) 12:16:14.11ID:KLLs4bsx
deepseekがgrok、Claudeをアシストする感じになってしまってるような気がする
2025/02/27(木) 12:18:24.32ID:JDfC5fH8
いやいや見事にアシストしたと言うだろうこれは
994名無しさん@お腹いっぱい。
2025/02/27(木) 12:23:16.73ID:RRUT+gbw995名無しさん@お腹いっぱい。
2025/02/27(木) 12:25:27.90ID:ClELfbUo 【ChatGPT】AIチャット総合 34【Gemini・Claude】
で立てるよ
で立てるよ
996名無しさん@お腹いっぱい。
2025/02/27(木) 12:28:46.27ID:ClELfbUo 【ChatGPT】AIチャット総合 34【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1740626816/
こっち埋めてからね
https://mevius.5ch.net/test/read.cgi/esite/1740626816/
こっち埋めてからね
2025/02/27(木) 12:31:44.37ID:d/s4Vez3
4.5たのしみだわ
998名無しさん@お腹いっぱい。
2025/02/27(木) 12:38:49.12ID:n9g7RwFg >>973
やはりOpenAI社員の匂わせスキルは超一流…
やはりOpenAI社員の匂わせスキルは超一流…
2025/02/27(木) 12:39:52.93ID:oLxws4vm
>>996
乙
乙
1000名無しさん@お腹いっぱい。 ころころ
2025/02/27(木) 12:40:54.33ID:ygR5lezK 梅
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 8日 17時間 56分 16秒
新しいスレッドを立ててください。
life time: 8日 17時間 56分 16秒
10021002
Over 1000Thread 5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【芸能】中居正広氏側に助言の橋下徹氏、性暴力の解釈巡り 「意に反すれば全てアウトでは、後から言えば全部アウトになるのかと」★2 [冬月記者★]
- 【永野芽郁】クラシエ「いち髪」公式サイトから削除「ブランドの価値を伝えていくことが難しい」 これで8社目 [Ailuropoda melanoleuca★]
- 自民・小野寺政調会長「国がもうけてどうすんだ」 備蓄米を安値で売り出し検討 動画あり [お断り★]
- 【MLB】佐々木朗希が激白! 負傷者リスト入りは「投げ続けたいが、逆に迷惑かかるので申告」「ロッテ時代の古傷が完治しない中で…」★2 [冬月記者★]
- 「レンタル高校生」が困りごとや要望に応えます 91歳男性の家で庭の草取り [お断り★]
- 就職氷河期世代が苦難激白「正社員になれるシステムがなかった」「政治は高齢者に対策したが氷河期世代はなし」 ★5 [お断り★]
- ガンダムGquuuuuX、ガチで終わる、考察要素だと思われたモノがすべからくアイドルオタクの監督の趣味と判明して終わる ★4 [348480855]
- 【悲報】斎藤元彦陣営のネット広報担当会社が投稿したnoteで騒然★693 [931948549]
- 【悲報】大阪万博で「ミニ四駆大会」開催のお知らせ🥹 [616817505]
- 【朗報】🇯🇵日本女性の平均寿命、87.14歳で世界1位👑に輝くwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww [573041775]
- 東日本大震災を当てた日本人予言者「2025年7月に大災害が起きる!」これまじ? [315836336]
- 【朗報】大人気ドーナツ🍩屋さん、日本初上陸、お前ら急げ [977261419]