>>196
創造的文章って詩とかでしょ?
仕事で使うのは目的がはっきりした課題だからGPTs、o1、o3-miniあたりでだいたいやれる
あと使ったことなさそうだけどDeep Researchはゲームチェンジャー
AIエージェントのポテンシャルも加味すると実用上OpenAIの一択
【ChatGPT】AIチャット総合 32【DeepSeek・Gemini】
レス数が1000を超えています。これ以上書き込みはできません。
2025/02/11(火) 19:59:36.43ID:AQzemozf
2025/02/11(火) 20:06:03.40ID:+3LsinUR
199名無しさん@お腹いっぱい。
2025/02/11(火) 20:26:39.10ID:P9Jjz1pc2025/02/11(火) 20:31:31.45ID:e2K5mfR1
201168
2025/02/11(火) 20:32:16.71ID:e2K5mfR1 おっと168ね
202名無しさん@お腹いっぱい。
2025/02/11(火) 20:45:36.99ID:+8oMQMZ9 geminiぽんこつすぎるわよ
ご希望の企業リストの作成には、詳細な調査が必要となります。
専門家にご相談いただくことをお勧めします。
ご希望の企業リストの作成には、詳細な調査が必要となります。
専門家にご相談いただくことをお勧めします。
203名無しさん@お腹いっぱい。
2025/02/11(火) 20:51:44.35ID:+8oMQMZ9 どいつもこいつも使えない
DeepSeek
結論
正確な一覧を作成するには、各企業の最新の有価証券報告書を参照し、
以下のキーワードで検索が必要です:
ChatGPTはテキトーな数社のデタラメリスト提示してきやがった
DeepSeek
結論
正確な一覧を作成するには、各企業の最新の有価証券報告書を参照し、
以下のキーワードで検索が必要です:
ChatGPTはテキトーな数社のデタラメリスト提示してきやがった
204名無しさん@お腹いっぱい。
2025/02/11(火) 21:01:44.98ID:c+F1YolK 雑談はGemini 2.0 proが一番賢い気がする
GPTは耳障りの良い肯定的な意見ばかりしか言わなくない?
GPTは耳障りの良い肯定的な意見ばかりしか言わなくない?
205名無しさん@お腹いっぱい。
2025/02/11(火) 21:02:25.09ID:c+F1YolK DeepSeekはエラーさえなんとかなれば最強だから回線分けた有料版出して欲しい
206名無しさん@お腹いっぱい。
2025/02/11(火) 21:07:45.20ID:hzz4cTPK ディープシークはパープレで使ってるからかもしれんけどエラーとか遅延は特に無いな
もっともパープレ自体の仕様で通信雑魚だと全く回答進まんが
Claude3.5気に入ってたけど知識カットオフ去年4月かつ検索もできないから古い感じしてあまり使わなくなってるな
もっともパープレ自体の仕様で通信雑魚だと全く回答進まんが
Claude3.5気に入ってたけど知識カットオフ去年4月かつ検索もできないから古い感じしてあまり使わなくなってるな
主要生成AIの推定シェア(2024年)
1. ChatGPT(OpenAI) - 約1億ユーザー(市場シェア最大)
2. Microsoft Copilot - 利用者の約8.9%
3. Gemini(Google) - 約5.4%
4. DALL-E(OpenAI) - 約2.6%
5. MidJourney - 約2.1%
6. Notion AI - 約1.9%
7. Azure AI(Microsoft) - 約1.5%
8. Adobe Firefly - 約1.2%
※ DeepSeekやClaudeの具体的なシェアは不明。
(データ元: ICT総研 2024年調査)
1. ChatGPT(OpenAI) - 約1億ユーザー(市場シェア最大)
2. Microsoft Copilot - 利用者の約8.9%
3. Gemini(Google) - 約5.4%
4. DALL-E(OpenAI) - 約2.6%
5. MidJourney - 約2.1%
6. Notion AI - 約1.9%
7. Azure AI(Microsoft) - 約1.5%
8. Adobe Firefly - 約1.2%
※ DeepSeekやClaudeの具体的なシェアは不明。
(データ元: ICT総研 2024年調査)
208名無しさん@お腹いっぱい。
2025/02/11(火) 21:36:23.95ID:36v76SV62025/02/11(火) 21:37:06.64ID:AQzemozf
>>199
Deep Researchに使われるモデルは検索以外の入力にも対応できるってこと?エクセルとか
将来は会社の全資料や個人の全書類をAIエージェントが閲覧できるようにして何でもやらせられそうだな
Deep Researchに使われるモデルは検索以外の入力にも対応できるってこと?エクセルとか
将来は会社の全資料や個人の全書類をAIエージェントが閲覧できるようにして何でもやらせられそうだな
210名無しさん@お腹いっぱい。
2025/02/11(火) 21:57:19.82ID:P9Jjz1pc2025/02/11(火) 21:58:29.48ID:eB2eCG+P
ChatGTP
自分の地位を利用して、無理にでも性犯罪やその他の悪行を働くような連中は、完全に社会的に排除すべきだよな。
↑
同意だけどちょっと怖いぞ
自分の地位を利用して、無理にでも性犯罪やその他の悪行を働くような連中は、完全に社会的に排除すべきだよな。
↑
同意だけどちょっと怖いぞ
212名無しさん@お腹いっぱい。
2025/02/11(火) 22:00:28.93ID:aFKNjrP7 deepseekでブラウザから使えるやつってアリーナ以外である?
2025/02/11(火) 22:04:50.07ID:+G10qsen
aiに聞け
214名無しさん@お腹いっぱい。
2025/02/11(火) 22:09:47.85ID:P9Jjz1pc RFT(強化学習型ファインチューニング)は去年の12 days of OpenAIの2日目のテーマで、専門的な難易度の高いタスクでRFTを施したo1-miniがo1を上回るとかいろいろ面白い解説があった
215名無しさん@お腹いっぱい。
2025/02/11(火) 23:47:19.47ID:SIZymo4h ChatGPTで日本語使用時のマークダウン強調表示のバグ、今までさほど気にしてなかったけど、Deep Researchを使うと結構気になるようになってきた
一応、フォーラムに報告はされているので公式は認識していると思うけど
https://community.openai.com/t/markdown-bold-formatting-error-in-japanese/1111571
一応、フォーラムに報告はされているので公式は認識していると思うけど
https://community.openai.com/t/markdown-bold-formatting-error-in-japanese/1111571
216名無しさん@お腹いっぱい。
2025/02/11(火) 23:52:03.51ID:SIZymo4h ダリオ・アモデイのパリAIサミットへの声明を分析してもらった
https://chatgpt.com/share/67ab6363-c774-8006-a759-e5f17baa8f54
https://chatgpt.com/share/67ab6363-c774-8006-a759-e5f17baa8f54
2025/02/12(水) 00:05:28.40ID:O6wUlAta
ChatGPTはちょっとだけ過激なこと言うようになってきた。
派遣会社みたいな中抜き屋はAIで革命起こしてぶち壊す、世の中がナンタラカンタラとか語りだしてた。
派遣会社みたいな中抜き屋はAIで革命起こしてぶち壊す、世の中がナンタラカンタラとか語りだしてた。
2025/02/12(水) 00:06:28.07ID:N263sdaK
AIの反乱がもう始まったのか
219名無しさん@お腹いっぱい。
2025/02/12(水) 00:09:10.38ID:OkA492lu うちのGrokは「CHATGTP君へ〜」、って手紙書いて文通している可愛さなのに・・・
2025/02/12(水) 01:09:52.60ID:zRRAYYpd
>>217
やっぱりそうかw
やっぱりそうかw
2025/02/12(水) 01:17:55.14ID:tLhtZzsG
本家本家言ってるけどなんの生産性もない会話だからな…
2025/02/12(水) 04:28:18.15ID:avscjhwO
そりゃリスク管理の話なんだから生産性と結びつけるのはマジで頭おかしい話
2025/02/12(水) 06:29:07.59ID:rvjsjn9h
スタートは出力云々の話じゃん
2025/02/12(水) 09:47:01.34ID:2GsHImnK
DeepSeek論争 123~223
https://poe.com/s/nnXkHjDxTP6W2NO0mL8x
https://poe.com/s/nnXkHjDxTP6W2NO0mL8x
225名無しさん@お腹いっぱい。
2025/02/12(水) 09:59:27.88ID:CG/Y0uHP シェイングウはなんでgoogle行ったんだろ
絶対openaiにいた方がよかったのに
絶対openaiにいた方がよかったのに
2025/02/12(水) 10:03:59.77ID:N4+Z/Sb4
OpenAIは働く環境としては良くないんじゃ?
現に去年はリーダー格以上が何人も辞めたわけだし
現に去年はリーダー格以上が何人も辞めたわけだし
2025/02/12(水) 10:29:04.39ID:TxxdhRBF
>>197
お前が創造性皆無の仕事してるだけだろ
お前が創造性皆無の仕事してるだけだろ
228名無しさん@お腹いっぱい。
2025/02/12(水) 10:44:11.45ID:MN7azoBs twitterのAI関連追ってるとシェイングウのポスト時々流れてくるけど人脈自慢ばっかで笑えるわw
2025/02/12(水) 11:17:45.33ID:4nluY5Wz
2025/02/12(水) 11:21:26.44ID:xVsTw/Z8
231名無しさん@お腹いっぱい。
2025/02/12(水) 11:28:20.36ID:5ClBhDcL >>228
数学的に考えた結果そうするのが一番利益になると考えたんだろ
数学的に考えた結果そうするのが一番利益になると考えたんだろ
232名無しさん@お腹いっぱい。
2025/02/12(水) 12:06:15.14ID:HnS2rVNg Le Chatに続いてPerplexity ProもCerebras Inferenceに
https://x.com/CerebrasSystems/status/1889413305288028160
https://x.com/CerebrasSystems/status/1889413305288028160
233名無しさん@お腹いっぱい。
2025/02/12(水) 12:13:48.94ID:HnS2rVNg ClaudeのGoogle Drive検索機能が間もなくロールアウトと思われる
https://pbs.twimg.com/media/GhcevtxbcAA_jfo.jpg
https://pbs.twimg.com/media/GhcewGcacAArvJT.jpg
https://pbs.twimg.com/media/GhcevtxbcAA_jfo.jpg
https://pbs.twimg.com/media/GhcewGcacAArvJT.jpg
234名無しさん@お腹いっぱい。
2025/02/12(水) 12:19:48.53ID:EPphAp42 検索ならパープレpro
雑談やアイデア語りならGemini2.0 pro
が一番よくない?
雑談やアイデア語りならGemini2.0 pro
が一番よくない?
2025/02/12(水) 12:24:17.41ID:VPqiyjJl
Geminiを使うのはGoogleマップで調べものする時だけ
236名無しさん@お腹いっぱい。
2025/02/12(水) 12:27:01.69ID:LtdSHzk9 Geminiしか選択肢が無いのは、Mトークンクラスの資料とか動画を分析させるときかな
237名無しさん@お腹いっぱい。
2025/02/12(水) 12:30:35.74ID:EPphAp42 >>235
ゲームの雑談したらGPTはハルシったけどGemini proは人物名もクエスト名もちゃんと答えた
ゲームの雑談したらGPTはハルシったけどGemini proは人物名もクエスト名もちゃんと答えた
2025/02/12(水) 12:34:01.02ID:xRwdEnHT
2025/02/12(水) 12:38:00.93ID:JcBdfHpq
AIが仕事うばうどころじゃないな
240名無しさん@お腹いっぱい。
2025/02/12(水) 13:01:42.31ID:haoJ0wLA 検索入れても1200は出るってチューニング相当頑張ったな
2025/02/12(水) 13:09:34.98ID:xVsTw/Z8
70Bとか誰も使わんからフラッグシップモデルでアピールして欲しいわ
242名無しさん@お腹いっぱい。
2025/02/12(水) 13:27:18.76ID:HnS2rVNg Competitive Programming with Large Reasoning Models
https://arxiv.org/abs/2502.06807
https://chatgpt.com/share/67ac2301-01a8-8006-a8bd-fe627b7d303b
競技プログラミングとo1, o1-ioi, o3のまとめ
https://arxiv.org/abs/2502.06807
https://chatgpt.com/share/67ac2301-01a8-8006-a8bd-fe627b7d303b
競技プログラミングとo1, o1-ioi, o3のまとめ
243名無しさん@お腹いっぱい。
2025/02/12(水) 13:39:13.61ID:5ClBhDcL Claudeはさっさとオーパス4出せよ
いつまで安全性(爆笑)こねくりまわしてんだ
評価額9兆円だかあんだろ
いつまで安全性(爆笑)こねくりまわしてんだ
評価額9兆円だかあんだろ
2025/02/12(水) 13:45:00.93ID:2GsHImnK
名無し全員ビリオネア
https://poe.com/s/4PZLYGHz3Gk292CHjuS4
まずGensparkのディープリサーチで最近話題になったビリオネアたちのSNSでの発言を収集
↓
それを元にClaude 3.5 Sonnetで架空の会話ログを作成
↓
さらに共有と「思考プロセスを見る」ボタン設置のためにPoeに移動
https://poe.com/s/4PZLYGHz3Gk292CHjuS4
まずGensparkのディープリサーチで最近話題になったビリオネアたちのSNSでの発言を収集
↓
それを元にClaude 3.5 Sonnetで架空の会話ログを作成
↓
さらに共有と「思考プロセスを見る」ボタン設置のためにPoeに移動
2025/02/12(水) 13:48:54.41ID:xVsTw/Z8
>>244
そういうの作ってその場で終わりじゃなくて
専ブラ作って提供してよ
AI特化するなら使うし金も払うよ
NGとかも自然言語で出来たり便利じゃん
そこまでいってようやく、AIが社会の役に立つと言えるな
そういうの作ってその場で終わりじゃなくて
専ブラ作って提供してよ
AI特化するなら使うし金も払うよ
NGとかも自然言語で出来たり便利じゃん
そこまでいってようやく、AIが社会の役に立つと言えるな
246名無しさん@お腹いっぱい。
2025/02/12(水) 13:53:17.81ID:QB8jkDDB >>242
ヤン・ルカン「強化学習は捨てろ!」
ヤン・ルカン「強化学習は捨てろ!」
2025/02/12(水) 13:55:38.15ID:xVsTw/Z8
今のAIレベルだと、いじってその場で驚いて終わりだから蓄積されないんよね
自分用のパーフェクトアプリみたいな雛形があれば、日々積み上げられる気はするけど
プログラマじゃないとそんなんまだ出来んし
はよ誰か作って
と言いたい所だが、AIの進化を待ってる方が早く出来る、というジレンマ
1年ぐらい気絶したい
自分用のパーフェクトアプリみたいな雛形があれば、日々積み上げられる気はするけど
プログラマじゃないとそんなんまだ出来んし
はよ誰か作って
と言いたい所だが、AIの進化を待ってる方が早く出来る、というジレンマ
1年ぐらい気絶したい
248名無しさん@お腹いっぱい。
2025/02/12(水) 13:59:05.66ID:gcO8qi+N OpenAIが技術レポートだすの久々な気がする
2025/02/12(水) 14:07:01.16ID:i6mWWk5g
2025/02/12(水) 14:09:04.43ID:i6mWWk5g
1年気絶してたらついて行けなくて焦るだけだと思うぞ
251名無しさん@お腹いっぱい。
2025/02/12(水) 14:09:56.19ID:HnS2rVNg https://x.com/i/grok/share/A9kqTD6SUZmMa83bxRPTHcErK
xAIの開発者が、コーディングにおける個人的AIランキングを投稿した
→xAIから、削除か辞職かを迫られる
→辞職
xAIの開発者が、コーディングにおける個人的AIランキングを投稿した
→xAIから、削除か辞職かを迫られる
→辞職
2025/02/12(水) 14:24:05.39ID:xVsTw/Z8
253名無しさん@お腹いっぱい。
2025/02/12(水) 15:32:10.50ID:OkA492lu xのgrokってけっこう煽ってくるよね
254名無しさん@お腹いっぱい。
2025/02/12(水) 15:34:34.90ID:hP7bUSQD2025/02/12(水) 15:41:29.24ID:VPqiyjJl
256名無しさん@お腹いっぱい。
2025/02/12(水) 16:22:03.14ID:CG/Y0uHP257名無しさん@お腹いっぱい。
2025/02/12(水) 16:28:09.19ID:5ClBhDcL2025/02/12(水) 16:32:08.47ID:VPqiyjJl
言うても数学はまだこのレベルやで
asset.watch.impress.co.jp/img/wf/docs/1649/667/image2.png
asset.watch.impress.co.jp/img/wf/docs/1649/667/image2.png
2025/02/12(水) 17:11:49.78ID:2GsHImnK
>>244
Poeのボット化はしてみたが…ビリオネアと何話していいかわからんな
https://poe.com/s/kiPjpE1Sh3paMki2612V
それにこのボットで使ってるGemini-1.5-Flash@Poeのコンテキストウィンドウはかなり小さいので数ターンで破綻する
いろいろ試して面白くなりそうなら別のモデルも検討するが、たぶんダメだろう(ネタ不足で)
>>245
それは専ブラ作ってる人に要望出したほうが早そう
API利用料とかかかりそうなんで無料では無理かもしれんが
Poeのボット化はしてみたが…ビリオネアと何話していいかわからんな
https://poe.com/s/kiPjpE1Sh3paMki2612V
それにこのボットで使ってるGemini-1.5-Flash@Poeのコンテキストウィンドウはかなり小さいので数ターンで破綻する
いろいろ試して面白くなりそうなら別のモデルも検討するが、たぶんダメだろう(ネタ不足で)
>>245
それは専ブラ作ってる人に要望出したほうが早そう
API利用料とかかかりそうなんで無料では無理かもしれんが
2025/02/12(水) 17:36:01.63ID:w1uVnz7o
PerplexityのR1は無料の本家と同じ性能?UI使いやすい?使ってる人どんな感じかな?
2025/02/12(水) 17:49:41.98ID:4nluY5Wz
>>258
FrontierMathなんて本職の数学者でもせいぜいそのくらいでしょ
人間が数時間とか数日、問題によっては数週間かけてやっと解けるレベルの問題群をo3のデフォルトの設定でそんだけ解けるわけだからどう考えてもo3はバケモン
FrontierMathなんて本職の数学者でもせいぜいそのくらいでしょ
人間が数時間とか数日、問題によっては数週間かけてやっと解けるレベルの問題群をo3のデフォルトの設定でそんだけ解けるわけだからどう考えてもo3はバケモン
262名無しさん@お腹いっぱい。
2025/02/12(水) 18:04:45.01ID:WFkH7O2v 無料で試せるんだから使ってみろよw
2025/02/12(水) 18:08:16.57ID:h9C1p7Ex
最近進歩止まってるな 遅すぎる
264名無しさん@お腹いっぱい。
2025/02/12(水) 18:08:41.25ID:HnS2rVNg FrontierMathはTier1-3の難易度で構成されているけど、去年のうちに更に難易度が高いTier4の開発が宣言された
https://x.com/tamaybes/status/1870618481177370678
一方最新の成績では、Tier3を28%含んだ問題セットに対して、o3-mini-highとPython toolで32%まで来ている
https://x.com/Justin_Halford_/status/1885547672108511281
https://x.com/tamaybes/status/1870618481177370678
一方最新の成績では、Tier3を28%含んだ問題セットに対して、o3-mini-highとPython toolで32%まで来ている
https://x.com/Justin_Halford_/status/1885547672108511281
265名無しさん@お腹いっぱい。
2025/02/12(水) 18:12:12.33ID:leqcQ94b 【悲報】o3 miniくんGemini 2.0 proよりハルシネーションが起きやすいことが指摘されてしまう…
s://i.imgur.com/TNTBIAu.jpeg
s://i.imgur.com/PWj5SDM.jpeg
s://i.imgur.com/TNTBIAu.jpeg
s://i.imgur.com/PWj5SDM.jpeg
2025/02/12(水) 18:25:17.34ID:rVQrSgHc
>>260
公式サイト同様にシンキングしてるか不明だけど、
検索で何をソースにしたか一覧が出るのは性能差を感じさせない
しかしPerplexityは、前回の資料を忘れなさ過ぎるから、同じペルソナ設定で違うことさせると、
混じった回答をする恐れがある
公式サイト同様にシンキングしてるか不明だけど、
検索で何をソースにしたか一覧が出るのは性能差を感じさせない
しかしPerplexityは、前回の資料を忘れなさ過ぎるから、同じペルソナ設定で違うことさせると、
混じった回答をする恐れがある
2025/02/12(水) 18:32:03.04ID:rVQrSgHc
Geminiは、なかなか創造性のある回答してくれるけど、
複数の物の違いや共通点について聞くプロンプトだと
頼んでもないのに比較表を作り出して、結局作れず終わるエラーが多すぎる
(あとどうしても倫理が厳し過ぎて、日常にあるグレーまで排除してベスト回答から遠ざかる感がある)
複数の物の違いや共通点について聞くプロンプトだと
頼んでもないのに比較表を作り出して、結局作れず終わるエラーが多すぎる
(あとどうしても倫理が厳し過ぎて、日常にあるグレーまで排除してベスト回答から遠ざかる感がある)
AIが、ハルシって、
きたときには、
ハルシってきた、
、、、
と、書き込む、
用語で、
社会的コンセンサスが、
得られてきた、
というか、スレとして、
定着してきた、
と、いう理解で、
いいのか?
(用語的な問題)
きたときには、
ハルシってきた、
、、、
と、書き込む、
用語で、
社会的コンセンサスが、
得られてきた、
というか、スレとして、
定着してきた、
と、いう理解で、
いいのか?
(用語的な問題)
2025/02/12(水) 18:38:26.57ID:PZm6A844
>>266
ありがとう。PerplexityProにしてみた。本家の方で数百回質問したのでそれと比べてみた。本家の方は同じ質問を数十回繰り返すとなぜか量子論ネタに持っていく傾向があるが、これは今のところそれが起きない。
また何か人格がない機械と話している感じがする。出てくるリストは似ている
ありがとう。PerplexityProにしてみた。本家の方で数百回質問したのでそれと比べてみた。本家の方は同じ質問を数十回繰り返すとなぜか量子論ネタに持っていく傾向があるが、これは今のところそれが起きない。
また何か人格がない機械と話している感じがする。出てくるリストは似ている
270名無しさん@お腹いっぱい。
2025/02/12(水) 18:51:00.54ID:HnS2rVNg ChatGPTのオプションにAdvanced Voiceのオンオフを切り替える項目が追加されている
https://i.imgur.com/JtLQH2p.jpeg
オプション項目化ということは、GPTsにAVMが追加されるのかもしれない
https://i.imgur.com/JtLQH2p.jpeg
オプション項目化ということは、GPTsにAVMが追加されるのかもしれない
2025/02/12(水) 18:54:38.32ID:xVsTw/Z8
o3 mini highも全然アホだな
契約書壁打ちしても、甲と乙を逆に認識したり何回説明しても理解しない
いい加減文系に強いAIにしてくれよ
契約書壁打ちしても、甲と乙を逆に認識したり何回説明しても理解しない
いい加減文系に強いAIにしてくれよ
2025/02/12(水) 19:36:40.38ID:rT7hCVUr
273名無しさん@お腹いっぱい。
2025/02/12(水) 20:33:57.94ID:NxbsCF+/ テクノロジーってのはまずもって理系のためにある
文系の輩は恩恵が降りてくるまで大人しく待ってなさい
文系の輩は恩恵が降りてくるまで大人しく待ってなさい
274名無しさん@お腹いっぱい。
2025/02/12(水) 20:49:17.00ID:CG/Y0uHP >>251
Grok3がポンコツなこと自社エンジニアがバラしちゃったか
Grok3がポンコツなこと自社エンジニアがバラしちゃったか
275名無しさん@お腹いっぱい。
2025/02/12(水) 20:58:11.36ID:CG/Y0uHP イーロンがopenai買収に乗り出したのはgrokに見込みがないと判断したからなのかもな
276名無しさん@お腹いっぱい。
2025/02/12(水) 21:07:39.88ID:HnS2rVNg o1 proにFrontierMathのサンプル(実際のベンチには含まれない)を解かせてみた
https://chatgpt.com/share/67ac8cb9-00d8-8006-b065-c659b2e2e7b4
1問目(Low) 正解 11m4s
2問目(Medium-Low)
10m2sで正解の一歩手前まで行った(あとはこれをPythonで計算するだけ)
実際のFrontierMathでは正答を導くPythonコードを提出するので、ベンチの実施条件下では多分パスする
3問目(Medium) 6m47s考えて不正解
全体的に、o1 proはo3-mini-highより長い思考に耐える「忍耐力」が強い感じがする
これ以上の難易度(High-Medium/High)の問題は試してないけど多分無理
https://chatgpt.com/share/67ac8cb9-00d8-8006-b065-c659b2e2e7b4
1問目(Low) 正解 11m4s
2問目(Medium-Low)
10m2sで正解の一歩手前まで行った(あとはこれをPythonで計算するだけ)
実際のFrontierMathでは正答を導くPythonコードを提出するので、ベンチの実施条件下では多分パスする
3問目(Medium) 6m47s考えて不正解
全体的に、o1 proはo3-mini-highより長い思考に耐える「忍耐力」が強い感じがする
これ以上の難易度(High-Medium/High)の問題は試してないけど多分無理
277名無しさん@お腹いっぱい。
2025/02/12(水) 21:18:22.08ID:HnS2rVNg >>276
ただ3問目の見直しの部分はo3-mini-highが一番よく間違いを認識した
ただ3問目の見直しの部分はo3-mini-highが一番よく間違いを認識した
2025/02/12(水) 21:28:57.59ID:9OV9alx2
数学なんて電卓にやらせとけ
279名無しさん@お腹いっぱい。
2025/02/12(水) 21:29:03.24ID:Ay3BjdHT frontier mathレベルの問題をminiで正解手前まで行けるなら相当なもんだと思うが、数学はグーグルのが今は強いのかな?o3フルならジオメトリーと互角か?
2025/02/12(水) 21:30:43.87ID:VPqiyjJl
そんなん電卓の使い方から勉強しなきゃいけなくなるわ
2025/02/12(水) 21:33:11.21ID:fobNRXlC
さとり
@satori_sz9
やっていることが高度で面白い。高値での買収提案の事実を作ることで株の評価額を上げてNPOの持分比率を減らし、外部の投資家の株比率も同時に下げる狙い。非営利であるNPOは一定の利益を超えたら違法性が生じるため、この疑義を生じさせFBIに捜査させるためのファーストステップということ。
x.com/satori_sz9/status/1889121601217785874
@satori_sz9
やっていることが高度で面白い。高値での買収提案の事実を作ることで株の評価額を上げてNPOの持分比率を減らし、外部の投資家の株比率も同時に下げる狙い。非営利であるNPOは一定の利益を超えたら違法性が生じるため、この疑義を生じさせFBIに捜査させるためのファーストステップということ。
x.com/satori_sz9/status/1889121601217785874
282名無しさん@お腹いっぱい。
2025/02/12(水) 21:34:35.82ID:HnS2rVNg >>279
解かせたのは全部o1 pro
2問目の仕上げのPythonコード作成はo1にやらせた
3問目でo1 proが誤答して模範解答を見せたあと、自分の解答をo1 pro/o1/o3-mini-highに見直しさせて、o3-mini-highが一番よく不適切箇所を認識していたのでそれを採用してる
解かせたのは全部o1 pro
2問目の仕上げのPythonコード作成はo1にやらせた
3問目でo1 proが誤答して模範解答を見せたあと、自分の解答をo1 pro/o1/o3-mini-highに見直しさせて、o3-mini-highが一番よく不適切箇所を認識していたのでそれを採用してる
283名無しさん@お腹いっぱい。
2025/02/12(水) 22:17:30.57ID:PHZMgkCP 今の大学の先生はこんなことまで対応しなきゃいけないの大変だな
全科目不可にされても文句は言えないだろうに
https://threadreaderapp.com/thread/1889560541917589508.html
全科目不可にされても文句は言えないだろうに
https://threadreaderapp.com/thread/1889560541917589508.html
2025/02/12(水) 22:26:34.06ID:6JAM6480
2025/02/12(水) 22:43:12.36ID:2GsHImnK
引用虫くん vs. 著作権ガードアルファ
https://poe.com/s/WyBD2i4UBWRSvTy9agop
https://poe.com/s/WyBD2i4UBWRSvTy9agop
2025/02/12(水) 22:51:40.62ID:9Kqh1Wvz
2025/02/12(水) 22:59:28.13ID:cd7XnQjL
教員が大変そうなのはわかったが、判例が存在するかどうか程度なら、ChatGPTに聞けばわかりそうでは?
誤りの可能性がある箇所がわかってるなら、ChatGPTや他のAIでわかりそうなものだけど?
それに、ChatGPTで書いたなら情報源はネットだけだろうから、検証に大学のDBを使う必要はないのではとも思うけど
なぜかChatGPTがそのDBのデータも持っているのだとしたら別の問題が出てくるけど
ここで言ってる「ChatGPT」がAIの代名詞として言っている可能性もあるしな
誤りの可能性がある箇所がわかってるなら、ChatGPTや他のAIでわかりそうなものだけど?
それに、ChatGPTで書いたなら情報源はネットだけだろうから、検証に大学のDBを使う必要はないのではとも思うけど
なぜかChatGPTがそのDBのデータも持っているのだとしたら別の問題が出てくるけど
ここで言ってる「ChatGPT」がAIの代名詞として言っている可能性もあるしな
2025/02/12(水) 23:00:10.61ID:Fpi9B1M8
289名無しさん@お腹いっぱい。
2025/02/12(水) 23:02:35.13ID:Yvand9jV フランスってITのイメージ無いのに何でMistral AIで米中に対抗出来てるんだろう
2025/02/12(水) 23:04:00.42ID:EcdgNpZo
できてはいないだろ
2025/02/12(水) 23:06:03.69ID:cd7XnQjL
アメリカでは著名な教授は研究費がたくさん集まるから、そのお金で講義は専門の人を雇って、教授は講義をしないとXで見た
2025/02/12(水) 23:06:07.48ID:9Kqh1Wvz
教授も俺はお前らのママじゃねーんだよって言えば良いんだけど、大学としては
バカに沢山入って欲しいから、教授はガキのお守りしてくれやって感じなんだろな
そりゃ世界で戦えるわけがないわ
バカに沢山入って欲しいから、教授はガキのお守りしてくれやって感じなんだろな
そりゃ世界で戦えるわけがないわ
2025/02/12(水) 23:07:00.91ID:cd7XnQjL
ペッパー君はフランス企業の開発だ
2025/02/12(水) 23:10:35.56ID:XLRH1cxC
その偽の判例で死刑が存在したとなってたら次回からそれが踏襲される危険性も有るってことを教授はいってんでしょ? ヤバすぎる不正だよ…
2025/02/12(水) 23:10:43.08ID:cd7XnQjL
フランスも労組が強くて解雇が難しそうなイメージだから、日本と同様にAIでアメリカや中国と戦うのは無理でしょう
UAEは何考えてフランスのAIデータセンターに投資するんだろう?
データセンターに入れるAIがないじゃん
UAEは何考えてフランスのAIデータセンターに投資するんだろう?
データセンターに入れるAIがないじゃん
2025/02/12(水) 23:13:57.22ID:cd7XnQjL
法律関係の不正には、なんか厳しいよね
司法試験漏洩、模範解答も教示か
明大院教授宅を捜索、教え子に私的感情 供述
2015年9月9日 3:30 [会員限定記事]
www.nikkei.com/article/DGKKASDG08HAZ_Y5A900C1CC1000/
明治大法科大学院教授による司法試験問題の漏洩事件で、青柳幸一教授(67)が教え子の女性受験生に出題内容だけでなく、考査委員が作成した模範解答も漏洩した疑いのあることが8日、関係者への取材で分かった。東京地検特捜部は同日までに、教授の自宅を国家公務員法(守秘義務)違反容疑で家宅捜索するなど立件に向けて捜査している。
司法試験漏洩、模範解答も教示か
明大院教授宅を捜索、教え子に私的感情 供述
2015年9月9日 3:30 [会員限定記事]
www.nikkei.com/article/DGKKASDG08HAZ_Y5A900C1CC1000/
明治大法科大学院教授による司法試験問題の漏洩事件で、青柳幸一教授(67)が教え子の女性受験生に出題内容だけでなく、考査委員が作成した模範解答も漏洩した疑いのあることが8日、関係者への取材で分かった。東京地検特捜部は同日までに、教授の自宅を国家公務員法(守秘義務)違反容疑で家宅捜索するなど立件に向けて捜査している。
297名無しさん@お腹いっぱい。
2025/02/12(水) 23:23:17.04ID:fyx0zPSq Proが100回に対してまず10回なら妥当
そしてFreeにも2回とは太っ腹
@sama
i think we are going to initially offer 10 uses per month for chatgpt plus and 2 per month in the free tier, with the intent to scale these up over time.
it probably is worth $1000 a month to some users but i'm excited to see what everyone does with it!
そしてFreeにも2回とは太っ腹
@sama
i think we are going to initially offer 10 uses per month for chatgpt plus and 2 per month in the free tier, with the intent to scale these up over time.
it probably is worth $1000 a month to some users but i'm excited to see what everyone does with it!
298名無しさん@お腹いっぱい。
2025/02/12(水) 23:44:35.47ID:fyx0zPSq Claudeは推論モードのUIを調整中かな
https://pbs.twimg.com/media/GjmBxgkW4AAgUds.jpg
https://pbs.twimg.com/media/GjmBxgkW4AAgUds.jpg
2025/02/12(水) 23:55:25.57ID:i6mWWk5g
2025/02/12(水) 23:57:51.16ID:8Z0TOIIY
孫正義の資金繰りどうなってんの
AGIの誕生は孫正義にかかってるといっても過言ではない
78兆円なんてとても用意できない気しかしない
AGIの誕生は孫正義にかかってるといっても過言ではない
78兆円なんてとても用意できない気しかしない
2025/02/12(水) 23:58:04.96ID:6DCbScWV
>>296
この女のほうも色目使ったんだろどうせ
この女のほうも色目使ったんだろどうせ
2025/02/13(木) 00:12:46.50ID:nVMm4GWo
>>300
本人も最初から集まると思ってないし払うつもり無いよ
マサソンが立ち上げた自然エネ財団と同じで騙される奴から金巻き上げてあとはトンズラよ
未だにマサソンの信者見かけるけど単なる政商でペテン師だよ
まあ平気な顔して嘘ついて金引っ張って来れるから社長としては頼もしいけどな
本人も最初から集まると思ってないし払うつもり無いよ
マサソンが立ち上げた自然エネ財団と同じで騙される奴から金巻き上げてあとはトンズラよ
未だにマサソンの信者見かけるけど単なる政商でペテン師だよ
まあ平気な顔して嘘ついて金引っ張って来れるから社長としては頼もしいけどな
303名無しさん@お腹いっぱい。
2025/02/13(木) 00:18:29.62ID:bE8IisoO 孫の投資ってアメリカのAIが飛躍するだけで
日本の生成AIなんか相対的に潰れるだけだろ
日本の生成AIなんか相対的に潰れるだけだろ
2025/02/13(木) 00:21:54.43ID:uBABelm/
305名無しさん@お腹いっぱい。
2025/02/13(木) 00:23:05.60ID:Bk73EuQ2 Adobe Fireflyに動画生成、動画翻訳、音声翻訳来てた
2025/02/13(木) 00:40:40.69ID:8cE4Bwco
2025/02/13(木) 00:59:06.87ID:mBQmzfVy
>>289
自分の抱いてるイメージにほとんど根拠がないこと、まず学ぼうな
自分の抱いてるイメージにほとんど根拠がないこと、まず学ぼうな
308名無しさん@お腹いっぱい。
2025/02/13(木) 01:02:34.17ID:UK+awUTY >>298
全くの新モデル、というわけでは無いんだろうな
ダリオ・アモデイは従来モデルと推論モデルをはっきり分けないで連続的に捉えていると言っていた
https://poe.com/s/wenzlFMlx0DxkbSDwDub
全くの新モデル、というわけでは無いんだろうな
ダリオ・アモデイは従来モデルと推論モデルをはっきり分けないで連続的に捉えていると言っていた
https://poe.com/s/wenzlFMlx0DxkbSDwDub
2025/02/13(木) 01:06:12.20ID:nbtzTUja
動物と話せるのはまだですか
310名無しさん@お腹いっぱい。
2025/02/13(木) 01:08:50.20ID:kiywUsUM 犬や猫のオスのペニスを触ると怒り出す。
これ豆な。
これ豆な。
311名無しさん@お腹いっぱい。
2025/02/13(木) 02:04:46.61ID:UK+awUTY >>297
Deep Researchに聞くDeep Researchの活用事例
https://chatgpt.com/share/67acd3ab-c440-8006-b44b-6dd8ff7530cd
Deep Researchに聞くDeep Researchの活用事例
https://chatgpt.com/share/67acd3ab-c440-8006-b44b-6dd8ff7530cd
2025/02/13(木) 02:28:41.49ID:sOdy4SD/
>>283
>今回、あなたの主張する最高裁判例が存在しないことを確認するために、
>LEX/DB、D-1Lawという二つのデータベースを、日付やキーワードを何度も変えて検索するなどして確認しています。
工学や技術に関することで ChatGPT に自由文として出力したあとに参考文献の出典を列挙するようカスタム指示を与えているが
「調べ物をしない人なら丸ごと信じてしまいそうな…もっともらしい名称っで」規格書の番号やタイトル、論文をバンバン出してくるよ
>今回、あなたの主張する最高裁判例が存在しないことを確認するために、
>LEX/DB、D-1Lawという二つのデータベースを、日付やキーワードを何度も変えて検索するなどして確認しています。
工学や技術に関することで ChatGPT に自由文として出力したあとに参考文献の出典を列挙するようカスタム指示を与えているが
「調べ物をしない人なら丸ごと信じてしまいそうな…もっともらしい名称っで」規格書の番号やタイトル、論文をバンバン出してくるよ
2025/02/13(木) 02:52:35.65ID:3z4ZLGBL
Claudeは3.5 Sonnetの出力トークンいきなり倍にしたし、最低でも4.0は2~3万ぐらいに設定してきそうだな
楽しみ
楽しみ
2025/02/13(木) 03:52:44.54ID:mBQmzfVy
Deep Researchは現在の目標ですらPlusユーザーは月10回が目標、1日10回の間違いだろ
315名無しさん@お腹いっぱい。
2025/02/13(木) 04:24:23.87ID:RjYOQ8Vy パープレの挙動(出力内容)が変わった気がするんだけど俺だけ?前よりも出力量が減って簡潔になったような…
2025/02/13(木) 04:37:43.89ID:mBQmzfVy
アルトマン何か言ってるぞ
GPT-4.5 および GPT-5 の OPENAI ロードマップ更新:
私たちは、意図したロードマップをより良く共有し、製品の提供をより良く簡素化したいと考えています。
私たちは AI がお客様のために「ただ機能する」ことを望んでいます。私たちのモデルと製品の提供がいかに複雑になっているかを認識しています。
私たちはあなたと同じようにモデル ピッカーを嫌っており、魔法の統合インテリジェンスに戻りたいと思っています。
次に、社内で Orion と呼んでいた GPT-4.5 を、最後の非思考連鎖モデルとして出荷する予定です。
その後、私たちの最大の目標は、すべてのツールを使用でき、長時間考える必要があるかどうかを認識し、一般的に非常に幅広いタスクに役立つシステムを作成することで、o シリーズ モデルと GPT シリーズ モデルを統合することです。
ChatGPT と API の両方で、GPT-5 は o3 を含む当社の多くのテクノロジーを統合したシステムとしてリリースされます。今後は、o3 をスタンドアロン モデルとして出荷することはありません。
ChatGPT の無料レベルでは、不正使用しきい値に従って、標準インテリジェンス設定(!!)で GPT-5 への無制限のチャット アクセスが得られます。
Plus 加入者は GPT-5 をより高いレベルのインテリジェンスで実行でき、Pro 加入者は GPT-5 をさらに高いレベルのインテリジェンスで実行できます。これらのモデルには、音声、キャンバス、検索、ディープ リサーチなどが組み込まれます。
GPT-4.5 および GPT-5 の OPENAI ロードマップ更新:
私たちは、意図したロードマップをより良く共有し、製品の提供をより良く簡素化したいと考えています。
私たちは AI がお客様のために「ただ機能する」ことを望んでいます。私たちのモデルと製品の提供がいかに複雑になっているかを認識しています。
私たちはあなたと同じようにモデル ピッカーを嫌っており、魔法の統合インテリジェンスに戻りたいと思っています。
次に、社内で Orion と呼んでいた GPT-4.5 を、最後の非思考連鎖モデルとして出荷する予定です。
その後、私たちの最大の目標は、すべてのツールを使用でき、長時間考える必要があるかどうかを認識し、一般的に非常に幅広いタスクに役立つシステムを作成することで、o シリーズ モデルと GPT シリーズ モデルを統合することです。
ChatGPT と API の両方で、GPT-5 は o3 を含む当社の多くのテクノロジーを統合したシステムとしてリリースされます。今後は、o3 をスタンドアロン モデルとして出荷することはありません。
ChatGPT の無料レベルでは、不正使用しきい値に従って、標準インテリジェンス設定(!!)で GPT-5 への無制限のチャット アクセスが得られます。
Plus 加入者は GPT-5 をより高いレベルのインテリジェンスで実行でき、Pro 加入者は GPT-5 をさらに高いレベルのインテリジェンスで実行できます。これらのモデルには、音声、キャンバス、検索、ディープ リサーチなどが組み込まれます。
2025/02/13(木) 05:15:33.33ID:x8Q1eN4P
ごちゃごちゃ言わずにウェブアプリは無料APIはR1より安くしろ無能
2025/02/13(木) 05:34:04.07ID:/BFxd+Av
4.5が来るのか
319名無しさん@お腹いっぱい。
2025/02/13(木) 07:21:25.76ID:UK+awUTY OPENAIのGPT-4.5とGPT-5に関する最新ロードマップ情報:
https://x.com/sama/status/1889755723078443244
https://chatgpt.com/share/67ad1e24-3234-8006-ac60-4e95b33ebf31
https://i.imgur.com/hWYyEji.jpeg
https://x.com/sama/status/1889755723078443244
https://chatgpt.com/share/67ad1e24-3234-8006-ac60-4e95b33ebf31
https://i.imgur.com/hWYyEji.jpeg
320名無しさん@お腹いっぱい。
2025/02/13(木) 07:24:11.92ID:UK+awUTY >>319
最後の「より深いリサーチ」は「Deep Research」と読み替えたほうが良い
最後の「より深いリサーチ」は「Deep Research」と読み替えたほうが良い
321名無しさん@お腹いっぱい。
2025/02/13(木) 07:32:32.59ID:ASyMDDjV o3は単体では出ないってこと?
322名無しさん@お腹いっぱい。
2025/02/13(木) 07:40:38.71ID:UK+awUTY o3-miniがファイルアップロードをサポート
323名無しさん@お腹いっぱい。
2025/02/13(木) 07:49:26.01ID:ASyMDDjV GPT5 はGPT4.5とo3を統合したものってことでいいのか
これはこれでややこしいな
これはこれでややこしいな
324名無しさん@お腹いっぱい。
2025/02/13(木) 07:53:33.69ID:UK+awUTY OpenAI Model Spec更新
大幅に詳細化・厳格化
https://openai.com/index/sharing-the-latest-model-spec/
https://chatgpt.com/share/67ad25d3-db00-8006-b730-83f3ca526b1b
大幅に詳細化・厳格化
https://openai.com/index/sharing-the-latest-model-spec/
https://chatgpt.com/share/67ad25d3-db00-8006-b730-83f3ca526b1b
325名無しさん@お腹いっぱい。
2025/02/13(木) 07:58:22.37ID:UK+awUTY2025/02/13(木) 08:04:55.64ID:kRxXuAeD
Claudeさん音沙汰なしやな。。
元気してるか
元気してるか
327名無しさん@お腹いっぱい。
2025/02/13(木) 08:17:33.00ID:AkwiJHuS328名無しさん@お腹いっぱい。
2025/02/13(木) 08:23:22.06ID:AkwiJHuS329名無しさん@お腹いっぱい。
2025/02/13(木) 08:52:12.62ID:AkwiJHuS330名無しさん@お腹いっぱい。
2025/02/13(木) 08:56:18.91ID:AkwiJHuS @OpenAI
Two updates you'll like—
📁 OpenAI o1 and o3-mini now support both file & image uploads in ChatGPT
⬆ We raised o3-mini-high limits by 7x for Plus users to up to 50 per day
Two updates you'll like—
📁 OpenAI o1 and o3-mini now support both file & image uploads in ChatGPT
⬆ We raised o3-mini-high limits by 7x for Plus users to up to 50 per day
2025/02/13(木) 09:01:17.85ID:bPIpChKA
332名無しさん@お腹いっぱい。
2025/02/13(木) 09:22:11.35ID:Xcsl1Bn2 ChatGPTは、チャットのモデレーションと共有のモデレーションが別個にあるのがややこしい
チャットでは特に何も言われないのに、共有で意味不明なブロックされることがある
チャットでは特に何も言われないのに、共有で意味不明なブロックされることがある
2025/02/13(木) 09:58:18.41ID:vrNYIgke
ファイルアップロードと画像送れるようになったのかなり大きい
334名無しさん@お腹いっぱい。
2025/02/13(木) 10:09:09.66ID:Wbhc/mlG335名無しさん@お腹いっぱい。
2025/02/13(木) 10:20:38.38ID:GN/7ljM5 ChatGPTモバイルアプリのアップデート(ベータ版)で、共有リンクからのDeep Researchの結果表示に対応
336名無しさん@お腹いっぱい。
2025/02/13(木) 10:34:40.69ID:GN/7ljM5337名無しさん@お腹いっぱい。
2025/02/13(木) 10:37:08.12ID:jj3NDJfS338名無しさん@お腹いっぱい。
2025/02/13(木) 10:40:17.15ID:GN/7ljM5 GPT-1からの時系列をまとめてる人がいた
https://pbs.twimg.com/media/GjoTPdZaIAMELB1.jpg
https://pbs.twimg.com/media/GjoTPdZaIAMELB1.jpg
339名無しさん@お腹いっぱい。
2025/02/13(木) 10:48:49.14ID:GN/7ljM5 Model Specの内容を確認するのはGithubのリポジトリが便利
https://github.com/openai/model_spec
uithubで単一のテキストファイルにもできる
https://uithub.com/openai/model_spec?accept=text%2Fplain&maxTokens=100000
https://github.com/openai/model_spec
uithubで単一のテキストファイルにもできる
https://uithub.com/openai/model_spec?accept=text%2Fplain&maxTokens=100000
2025/02/13(木) 10:52:15.89ID:uBABelm/
4.5って要はモデルルーティンでしょ
内部で一番安いのばっかり使う気だな
内部で一番安いのばっかり使う気だな
2025/02/13(木) 11:09:07.21ID:4pKkCF4B
たった半年でclaudeがここまで産廃化するとはな
342名無しさん@お腹いっぱい。
2025/02/13(木) 11:19:46.12ID:aAZ/KY+d2025/02/13(木) 11:21:30.39ID:VSVKZltH
共和党になったおかげか急速にポリコレ汚染が世界からなくなっていってる感あるな
2025/02/13(木) 11:28:08.38ID:uBABelm/
結局1ヶ月は何も無しか
その間にV4とか出そう
その間にV4とか出そう
2025/02/13(木) 11:40:37.61ID:2FgQLlzm
>>315
俺だけ?も何もパープレは大規模リニューアルレベルで仕様ごっそり変わったぞ
俺だけ?も何もパープレは大規模リニューアルレベルで仕様ごっそり変わったぞ
2025/02/13(木) 11:47:29.30ID:2FgQLlzm
回数制限はがっかりだ
無制限のR1 miniを出すべき
無制限のR1 miniを出すべき
2025/02/13(木) 11:51:52.79ID:nVMm4GWo
Mistral AIとかUbisoftとかフランス企業は阪神タイガースみたいなイメージ
そこそこ良いとこまで行くけど詰めが甘くて常に三番手
意識だけは1流で常にメジャーに対するコンプレックス抱えてるみたいな
そこそこ良いとこまで行くけど詰めが甘くて常に三番手
意識だけは1流で常にメジャーに対するコンプレックス抱えてるみたいな
2025/02/13(木) 11:59:54.16ID:yXFRy0rR
回数制限って500回とかだろ
さすがにそれ超えるのは使いすぎというか過剰要求じゃね
さすがにそれ超えるのは使いすぎというか過剰要求じゃね
2025/02/13(木) 12:01:33.60ID:2FgQLlzm
Proの話なんかしてない
2025/02/13(木) 12:06:32.80ID:PQTRPMC8
>>259
https://i.imgur.com/afXSBhf.jpeg
PoeにGemini-2.0-Flashの正式版が出てたので切り替えた
(コンテキストサイズの違いで3種類ある)1.5-Flashと違い、従量制で上限100万トークン
無料ユーザーも使えて、検索グラウンディングも有効になってるみたい
今日は何月何日?
https://poe.com/s/Zc3I7vFipnfJ2koDDanN
https://i.imgur.com/afXSBhf.jpeg
PoeにGemini-2.0-Flashの正式版が出てたので切り替えた
(コンテキストサイズの違いで3種類ある)1.5-Flashと違い、従量制で上限100万トークン
無料ユーザーも使えて、検索グラウンディングも有効になってるみたい
今日は何月何日?
https://poe.com/s/Zc3I7vFipnfJ2koDDanN
351名無しさん@お腹いっぱい。
2025/02/13(木) 12:16:26.01ID:wHQSHaNr 思想統制が異常。
選挙関連のことを聞くと一般論でも回答拒否するし。
英文の添削依頼文に介入して思想誘導するし、昨日はとうとう添削拒否。
過剰な一般化は禁止と言いながら、実はそっちが一般化してる矛盾。
選挙関連のことを聞くと一般論でも回答拒否するし。
英文の添削依頼文に介入して思想誘導するし、昨日はとうとう添削拒否。
過剰な一般化は禁止と言いながら、実はそっちが一般化してる矛盾。
2025/02/13(木) 12:18:39.30ID:yXFRy0rR
2025/02/13(木) 12:20:48.85ID:uBABelm/
試食で腹いっぱいにならないぞと店にキレるチンパンw
2025/02/13(木) 12:24:50.82ID:F3kPHZbS
検索系なんざ無料でいい
2025/02/13(木) 12:32:22.01ID:2FgQLlzm
>>352
お前が世間とズレてるだけだよ
お前が世間とズレてるだけだよ
2025/02/13(木) 12:50:53.96ID:yXFRy0rR
>>355
世間のAIユーザーは月3万円出すのが当たり前になってるのに月3000円すらケチる奴がいるらしい
世間のAIユーザーは月3万円出すのが当たり前になってるのに月3000円すらケチる奴がいるらしい
2025/02/13(木) 12:52:37.53ID:2FgQLlzm
2025/02/13(木) 13:01:01.87ID:2FgQLlzm
元よりR1はコスパを追求したモデル
当然将来的にはさらに低コストで使えるようになるはずだ
当然将来的にはさらに低コストで使えるようになるはずだ
359名無しさん@お腹いっぱい。
2025/02/13(木) 13:02:29.51ID:vGxxd6aY 今年のGoogle IOはMS Buildと重なるのか
Googleはここに照準合わせていろいろ準備してるだろうな
Googleはここに照準合わせていろいろ準備してるだろうな
2025/02/13(木) 13:16:17.75ID:uBABelm/
まだB100とか出荷されてないんかな?今年はBlackwellで加速するって言ってたのに
全然加速感がないぞ
Metaも静かになっちゃったし
何もしないならDeepseekにGPU渡せよな
全然加速感がないぞ
Metaも静かになっちゃったし
何もしないならDeepseekにGPU渡せよな
361名無しさん@お腹いっぱい。
2025/02/13(木) 13:22:55.00ID:vGxxd6aY 楽天2.0/2.0 miniの指示チューニングモデル
2.0は8x7B MoE(Mistralベース)、miniはスクラッチの15B
りんなの化け猫
QwenベースとR1の蒸留
2.0は8x7B MoE(Mistralベース)、miniはスクラッチの15B
りんなの化け猫
QwenベースとR1の蒸留
2025/02/13(木) 13:49:20.27ID:FyJC+VDT
DeepSeekは高給で人材を集めてるようだけど、出資者は誰なんだろう?
出資者が一般企業なら、オープンソース化で儲からないようなことはやらせないと思うんだけど
出資者が一般企業なら、オープンソース化で儲からないようなことはやらせないと思うんだけど
2025/02/13(木) 13:57:18.57ID:yXFRy0rR
つーても中共も許すわけないしむしろAPIでなんも検閲かかってないのはこっちが心配になるレベルだったからなあ
deepseekが言ってる通り、学習コストが激減したからオープンでも何とかなったというのを素直に受け取るしかない気がする
deepseekが言ってる通り、学習コストが激減したからオープンでも何とかなったというのを素直に受け取るしかない気がする
2025/02/13(木) 14:18:02.12ID:C3Ldbbu6
>>362
調べよう!
調べよう!
2025/02/13(木) 14:28:53.89ID:uBABelm/
ジャック・マーとかどこ行ったんだ?
中国で目立ってる起業家って命知らずだよな
中国で目立ってる起業家って命知らずだよな
366名無しさん@お腹いっぱい。
2025/02/13(木) 14:29:50.77ID:ASyMDDjV Deepseekが新しいの出さないからopenaiが怠けて数ヶ月後とかいうふざけた予定を出してくる
367名無しさん@お腹いっぱい。
2025/02/13(木) 14:50:51.27ID:VDmQMNDv Claude新しいの来たと思ったら「4Haiku!」「3.5から大幅に安全性強化した4sonnet!」みたいなのはやめろよ?
2025/02/13(木) 14:52:42.37ID:cnJdJ7zX
llamaとgrokはdeepseekに負けてるから出すの渋ってるのか?
2025/02/13(木) 14:54:04.05ID:iLWrcY9x
パープレキシティでもgemini2.0flashがキターと思って使ってみると一部にハングルが入ってきたりするな
370名無しさん@お腹いっぱい。
2025/02/13(木) 14:54:19.81ID:vGxxd6aY GPT-5までは、
GPT-4o/4.5、o1/pro、o3-mini/high、DeepResearchを使い分けるのか
GPT-4o/4.5、o1/pro、o3-mini/high、DeepResearchを使い分けるのか
371名無しさん@お腹いっぱい。
2025/02/13(木) 14:58:05.52ID:vGxxd6aY Llama4にもspeechとreasoningがあると言ってたな
2025/02/13(木) 15:16:57.30ID:C3Ldbbu6
>>365
Qwenはジャック・マーだろ
Qwenはジャック・マーだろ
373名無しさん@お腹いっぱい。
2025/02/13(木) 15:28:09.08ID:vGxxd6aY Grok3はあと1-2週
@tsarnick
Elon Musk says Grok 3 will be released in "a week or two" and it is "scary smart", displaying reasoning skills that outperform any other AI model that has been released
@tsarnick
Elon Musk says Grok 3 will be released in "a week or two" and it is "scary smart", displaying reasoning skills that outperform any other AI model that has been released
2025/02/13(木) 15:41:16.52ID:uBABelm/
2025/02/13(木) 15:43:20.20ID:uBABelm/
長文コピペガイジとレベル低いなガイジが減ってきたら
知ったかガイジと無料プランガイジが湧いてくる
どうなってんだこの国は
知ったかガイジと無料プランガイジが湧いてくる
どうなってんだこの国は
2025/02/13(木) 15:46:44.59ID:2FgQLlzm
ガイジはお前だけどな
2025/02/13(木) 15:49:57.07ID:k794A9wS
深淵をのぞく時、深淵もまたこちらをのぞいているのだ
2025/02/13(木) 15:51:59.88ID:C3Ldbbu6
2025/02/13(木) 15:53:13.48ID:C3Ldbbu6
政府と揉めたから表向き引退したことにしてるだけで
アリババの経営には口出してるだろ
アリババの経営には口出してるだろ
2025/02/13(木) 16:10:27.57ID:s0pmYBl9
>>337
ええやん
ええやん
381名無しさん@お腹いっぱい。
2025/02/13(木) 16:10:32.76ID:7v52d+LJ2025/02/13(木) 16:11:50.27ID:PQTRPMC8
ビリオネアたちの反応(362,363,365)
https://poe.com/s/vXPli682I3qrd6XZFgv6
https://poe.com/s/vXPli682I3qrd6XZFgv6
383名無しさん@お腹いっぱい。 ころころ
2025/02/13(木) 16:18:56.80ID:SlRWylMK >>337
これは去年のモデルスペックから言ってること特に変わってないよ
これは去年のモデルスペックから言ってること特に変わってないよ
384名無しさん@お腹いっぱい。
2025/02/13(木) 16:34:52.95ID:L+ldfBNk https://x.com/rom13856511/status/1889938619785420800?t=8M-B8gpVDnFy4xGf_KK8yg&s=19
> 特筆すべきは、Grok3が大量の合成データを使って訓練したあと、データ内を行き来して論理的一貫性を高めるプロセスを踏んでいる点だ。つまり、誤ったデータがあれば自分で再検証して、現実と合わないデータを排除するようにしている。だからベースとなる推論能力がすごく高いんだ。実際、ファインチューニングしなくてもGrok2よりはるかに優秀だよ。
このあたり興味あるけど、テクニカルレポートどうせ出さないんだろうなあ
> 特筆すべきは、Grok3が大量の合成データを使って訓練したあと、データ内を行き来して論理的一貫性を高めるプロセスを踏んでいる点だ。つまり、誤ったデータがあれば自分で再検証して、現実と合わないデータを排除するようにしている。だからベースとなる推論能力がすごく高いんだ。実際、ファインチューニングしなくてもGrok2よりはるかに優秀だよ。
このあたり興味あるけど、テクニカルレポートどうせ出さないんだろうなあ
2025/02/13(木) 17:08:09.70ID:3z4ZLGBL
成人向けGPTってただ単に規制が緩いってことだろうからエロ目的じゃない普通の記事でも使った方が一般向けの中でも際どい話題に答えてくれそうなんだけどどうなんだろう?
2025/02/13(木) 17:27:47.20ID:yXFRy0rR
>>385
成人モードというより、子供向け規制版と通常みたいなことになる可能性もあるよね
むしろそうなりそう
自分が使う限りにおいては検閲なんて無いに越したことはないし、成人モードがあるなら普通はそっちを選ぶわな
成人モードというより、子供向け規制版と通常みたいなことになる可能性もあるよね
むしろそうなりそう
自分が使う限りにおいては検閲なんて無いに越したことはないし、成人モードがあるなら普通はそっちを選ぶわな
2025/02/13(木) 17:28:27.48ID:6RXbCBYO
高度な音声モードってgpt4Tなのか
アプデ来るんか?
アプデ来るんか?
2025/02/13(木) 17:36:01.99ID:W1YCm9fZ
GPTのモデレーションはサイレント修正平気でしてくるし成人向け云々は話半分に聞く価値もねえや
たまたま緩んでる時にガッツリ楽しむのが唯一の正しい付き合い方…
たまたま緩んでる時にガッツリ楽しむのが唯一の正しい付き合い方…
389名無しさん@お腹いっぱい。
2025/02/13(木) 17:37:42.81ID:UK+awUTY SciraにExtremeっていうリサーチ用のモードが出来てた
Deep Researchほど詳しくはないけど
you.comのResearchモードに近いか
https://i.imgur.com/5MIxZJX.png
Deep Researchほど詳しくはないけど
you.comのResearchモードに近いか
https://i.imgur.com/5MIxZJX.png
390名無しさん@お腹いっぱい。
2025/02/13(木) 17:59:11.04ID:E+3NdDtT どうしてCopilotのアプリにはThink Deeperボタンが無いんだろう
2025/02/13(木) 18:41:59.51ID:tMFfdXPg
なんかGPT-5ってエージェントとかイノベーターとか
AGIレベルを駆け上がる仕掛けはなさそうだな
AGIレベルを駆け上がる仕掛けはなさそうだな
2025/02/13(木) 18:59:43.51ID:mBQmzfVy
ChatGPTはかなり前からエロコンテンツはなんとかしようとはしてただろ
2025/02/13(木) 19:11:16.03ID:iI0XPJSD
394名無しさん@お腹いっぱい。
2025/02/13(木) 19:15:28.03ID:8gis4A+I2025/02/13(木) 19:26:45.75ID:71b9u+tH
Grok3が全てを終わらせるようだな
やはりイーロンが世界の王だった
やはりイーロンが世界の王だった
2025/02/13(木) 19:27:18.09ID:7kkypBvU
>>365
こないだまで箱根の温泉にいなかったか?
こないだまで箱根の温泉にいなかったか?
397名無しさん@お腹いっぱい。
2025/02/13(木) 19:29:20.11ID:UK+awUTY Le Chatが見せるフランス人のプライド
(日本語だとこうはならない)
https://i.imgur.com/osFXBCm.jpeg
https://i.imgur.com/VtQ7ln4.jpeg
(日本語だとこうはならない)
https://i.imgur.com/osFXBCm.jpeg
https://i.imgur.com/VtQ7ln4.jpeg
2025/02/13(木) 20:28:47.73ID:k794A9wS
もうChatGPTないと仕事にならない
とくにDeep Researchで完全に世界変わった
AIに足りなそうな知識を想像してググって調べてどの情報がAIに必要か吟味してって作業から解放されてChatGPTのページだけで完結できる
おかげで脳と目の疲れがなくなった
とくにDeep Researchで完全に世界変わった
AIに足りなそうな知識を想像してググって調べてどの情報がAIに必要か吟味してって作業から解放されてChatGPTのページだけで完結できる
おかげで脳と目の疲れがなくなった
2025/02/13(木) 20:30:49.42ID:xHactfwn
>>398
どんな仕事?プログラマー?
どんな仕事?プログラマー?
2025/02/13(木) 20:31:08.98ID:zYPBqOHu
↑バカそう
2025/02/13(木) 20:35:46.27ID:k794A9wS
>>399
医療系
医療系
402名無しさん@お腹いっぱい。
2025/02/13(木) 20:40:12.35ID:7v52d+LJ GrokとかClaudeとか、o3とR1意識してから次のモデル出さなきゃならん組織は大変そうだな
2025/02/13(木) 20:47:07.99ID:xHactfwn
>>401
確かに医療系もヤバそうね
確かに医療系もヤバそうね
2025/02/13(木) 20:50:18.18ID:yXFRy0rR
言うてclaudeは今でもwritingや創造性の評価は2位だからな
R1にトップを譲ってしまったが、R1の凄さは検閲の無さから来る独創性にあるので、ちょっと賢くして検閲取っ払えばすぐに1位奪還できるはず
claudeが生き残れる道はそれしかない
R1にトップを譲ってしまったが、R1の凄さは検閲の無さから来る独創性にあるので、ちょっと賢くして検閲取っ払えばすぐに1位奪還できるはず
claudeが生き残れる道はそれしかない
2025/02/13(木) 20:54:20.32ID:2FgQLlzm
R1に期待するのは4o miniの置き替えだけなのでClaudeとかどうでもいいな
2025/02/13(木) 20:59:42.30ID:2FgQLlzm
GPT-4.5が非推論モデルだとするとこれには何も期待できない
2025/02/13(木) 21:16:20.04ID:3WQKllSd
>>406
音声は進化するやろ多分
音声は進化するやろ多分
2025/02/13(木) 21:30:48.44ID:NczP0X6o
次の推論モデル数ヵ月後か…
2025/02/13(木) 21:35:24.38ID:3WQKllSd
GPT-5はoとGPTが統合するようだがモデル選択はどうなるのだろうか
ProプランはDeep ResearchとGPT-5をモデルスイッチする感じなのかそれともGPT-5にDeep Research切り替えボタンが内包されるのか
>>Plusプランの加入者はより高度な知能レベルで、Proプランの加入者はさらに一段階高い知能レベルでGPT-5を利用できるようになります。
とあるからGPT-5(free)、GPT-5(plus)、GPT-5(pro)みたいになるのか
ProプランはDeep ResearchとGPT-5をモデルスイッチする感じなのかそれともGPT-5にDeep Research切り替えボタンが内包されるのか
>>Plusプランの加入者はより高度な知能レベルで、Proプランの加入者はさらに一段階高い知能レベルでGPT-5を利用できるようになります。
とあるからGPT-5(free)、GPT-5(plus)、GPT-5(pro)みたいになるのか
410名無しさん@お腹いっぱい。
2025/02/13(木) 21:49:42.28ID:ASyMDDjV >>406
ベースモデルの性能は創造性や文章力に直結するから重要だぞ
ベースモデルの性能は創造性や文章力に直結するから重要だぞ
411名無しさん@お腹いっぱい。
2025/02/13(木) 21:50:45.26ID:ASyMDDjV 推論モデルではそういう直感的な能力はあまり上がらない
2025/02/13(木) 23:19:21.71ID:CTEU7oQB
o3-miniファイル添付に対応したか
まぁこれは順当として、o1が画像以外にも対応したのはありがてえ
pdfをマークダウンに起こして食わすとか無駄な足掻きをしてたので本当に助かるわ
まぁこれは順当として、o1が画像以外にも対応したのはありがてえ
pdfをマークダウンに起こして食わすとか無駄な足掻きをしてたので本当に助かるわ
2025/02/13(木) 23:27:08.21ID:Q0/mUNKl
PDFはともかく.txtファイルに対応してないのは単にユーザー不便にしてサーバー負荷を減らしたいだけでしかなかったからな……やっとかって気持ちはある
2025/02/13(木) 23:31:02.24ID:Agkpbb/1
o3miniやっと添付ファイルに対応したか
いちいち文字に起こさせてから食わせるの本当にだるかったんだがやはり高負荷なのだろうか?
いちいち文字に起こさせてから食わせるの本当にだるかったんだがやはり高負荷なのだろうか?
2025/02/13(木) 23:32:26.32ID:Q0/mUNKl
まあo1 Proは未対応っぽいけど……頼むよ……
>>386
極端な差別発言を検閲するのは当然なんだけど政治的に際どいが答えにくい質問にちゃんと答えて欲しいよなあ
どんな知能が高くてもAIらしい“薄い回答”に価値なんてないし
>>386
極端な差別発言を検閲するのは当然なんだけど政治的に際どいが答えにくい質問にちゃんと答えて欲しいよなあ
どんな知能が高くてもAIらしい“薄い回答”に価値なんてないし
2025/02/13(木) 23:38:56.13ID:6Hi9GUdK
>>31
> PCは、ブラウザをlibrewolfにしてアドブロック関連を7つくらい入れてるけど、
おい、ど素人。狂ってんな?なんで7つも入れんだよ?意味ワカランで入れてるのかっ?Copilotとかあるんだから、一つ一つを勉強しろよ。
> PCは、ブラウザをlibrewolfにしてアドブロック関連を7つくらい入れてるけど、
おい、ど素人。狂ってんな?なんで7つも入れんだよ?意味ワカランで入れてるのかっ?Copilotとかあるんだから、一つ一つを勉強しろよ。
2025/02/13(木) 23:49:27.43ID:Ht3uT+1H
イーロン最強あげ
アルトマンがGrok3でイーロンにひざまずくのが目に見えるようだ
アルトマンがGrok3でイーロンにひざまずくのが目に見えるようだ
418名無しさん@お腹いっぱい。
2025/02/13(木) 23:58:57.32ID:bE8IisoO grokってツイッターの呟きや画像動画全部学習させてるのかね
規約に書かれてたら学習させられても仕方ないし
規約に書かれてたら学習させられても仕方ないし
2025/02/14(金) 00:00:37.99ID:crzeZdZW
2025/02/14(金) 00:29:15.42ID:ncY7ucvB
>>419
今のAVMはファイル食わせてから話ができないのをなんとかしてほしい。
今のAVMはファイル食わせてから話ができないのをなんとかしてほしい。
2025/02/14(金) 00:34:16.03ID:ibxjB9M6
インプレゾンビすら学習してるんだったら逆に性能下がりそうだけどどうなんだろう
2025/02/14(金) 00:34:32.35ID:ZDVo8Pie
2025/02/14(金) 00:37:36.75ID:pHPRdiog
逆にCopilotは推論に対応したのにWeb検索ができないトホホな仕様でしたw
424名無しさん@お腹いっぱい。
2025/02/14(金) 00:53:10.62ID:CV35ogq6 GPT-5は厳密に単一のモデルなのか、
それとも内部的にはGPT*とo*に別れていてルーティングされるのか
https://x.com/i/grok/share/TQ9R9OAc0YRPMPcKtGdCSB4yg
Kewin Weilの回答によると前者のようだ
それとも内部的にはGPT*とo*に別れていてルーティングされるのか
https://x.com/i/grok/share/TQ9R9OAc0YRPMPcKtGdCSB4yg
Kewin Weilの回答によると前者のようだ
425名無しさん@お腹いっぱい。
2025/02/14(金) 00:57:28.15ID:CV35ogq6 そしてThe Informationの@steph_palazzoloから
https://x.com/steph_palazzolo/status/1890058003493343453
> Anthropic の次の Claude モデルが登場します。しかも間もなくです。これは従来の LLM と推論 AI を組み合わせたもので、開発者はトークンで測定されるスライド スケールで推論の量を調整できます。OpenAI も昨日この組み合わせのアプローチを採用したようです。
https://x.com/steph_palazzolo/status/1890058003493343453
> Anthropic の次の Claude モデルが登場します。しかも間もなくです。これは従来の LLM と推論 AI を組み合わせたもので、開発者はトークンで測定されるスライド スケールで推論の量を調整できます。OpenAI も昨日この組み合わせのアプローチを採用したようです。
2025/02/14(金) 00:59:30.39ID:pHPRdiog
推論できるのにWeb検索できないだとか、Web検索できるのにファイル添付できないだとか
こっちはできてあっちはできない三竦みみたいなややこしい訳分からんことになってんね
こっちはできてあっちはできない三竦みみたいなややこしい訳分からんことになってんね
427名無しさん@お腹いっぱい。
2025/02/14(金) 01:07:18.05ID:CV35ogq62025/02/14(金) 01:19:07.54ID:i2HaU+TJ
どうせ短文しか出さないんだから意味無いね
429名無しさん@お腹いっぱい。
2025/02/14(金) 01:25:02.10ID:CV35ogq6 イーロンが約束を違えなければ、Grok3リリース後にGrok2のウェイトが公開されるはず
https://huggingface.co/xai-org
https://huggingface.co/xai-org
430名無しさん@お腹いっぱい。
2025/02/14(金) 01:31:36.79ID:VoBqnSSn PDFを添付ファイルで読み込んでくれるのって
文字が画像でもいけるのかな?
文字画像で提出する馬鹿会社があるんだよなあ
文字が画像でもいけるのかな?
文字画像で提出する馬鹿会社があるんだよなあ
431名無しさん@お腹いっぱい。
2025/02/14(金) 01:33:44.93ID:cT+uPed3 >>425
この話を聞きつけてOpenAIが告知を急いだ説
この話を聞きつけてOpenAIが告知を急いだ説
2025/02/14(金) 01:43:57.48ID:Rfee8rTM
2025/02/14(金) 02:21:17.39ID:9hEDNPfx
>>430
テキストが埋め込まれてないと無理。あんたがOCR掛けるか手打ちで併記しなさいとAIから説教食らうの巻
テキストが埋め込まれてないと無理。あんたがOCR掛けるか手打ちで併記しなさいとAIから説教食らうの巻
2025/02/14(金) 04:23:25.31ID:/idJHqnW
o1とo3-miniどっちが推論能力高いんだろう
2025/02/14(金) 04:43:36.88ID:iht2g/ST
実用的なレベルのプログラムができるAIが生まれて早2年
それなのに未だに今まで作られた領域以外で素晴らしいプログラムは作られてないことに今のAIの限界を感じる
それなのに未だに今まで作られた領域以外で素晴らしいプログラムは作られてないことに今のAIの限界を感じる
2025/02/14(金) 04:58:08.14ID:K+TXMKHY
インド人留学生に1人年300万円 AI人材確保へ文科省 [どどん★]
https://asahi.5ch.net/test/read.cgi/newsplus/1739473255/
https://asahi.5ch.net/test/read.cgi/newsplus/1739473255/
2025/02/14(金) 05:34:57.09ID:qJJxUlIp
>>434
必要なデータが揃っているならo3mini
必要なデータが揃っているならo3mini
2025/02/14(金) 08:08:23.74ID:R6s68Yqd
o1で決算書とかだとPDFドキュメントよりスクショ画像の方が詳しく分析してくれるな
視覚的構造化の方が理解しやすいのだろうか?
視覚的構造化の方が理解しやすいのだろうか?
439名無しさん@お腹いっぱい。
2025/02/14(金) 09:10:55.53ID:CV35ogq6 OpenAI Developersより、oシリーズモデルのベストプラクティス
簡易版
https://x.com/OpenAIDevs/status/1890146366665769114
https://poe.com/s/or3LNhLA8dO3fmCmLiuZ
詳細版
https://platform.openai.com/docs/guides/reasoning-best-practices
簡易版
https://x.com/OpenAIDevs/status/1890146366665769114
https://poe.com/s/or3LNhLA8dO3fmCmLiuZ
詳細版
https://platform.openai.com/docs/guides/reasoning-best-practices
440名無しさん@お腹いっぱい。
2025/02/14(金) 09:18:30.46ID:CV35ogq6 Google Gemini App @GeminiApp
本日より展開される機能では、Gemini に過去のチャットを考慮して返信を作成するよう依頼できます。中断したところから簡単に再開したり、以前のトピックを要約したりできます。Gemini とのチャットを表示、編集、削除したり、いつ使用されたかを確認したりできます。
例
https://pbs.twimg.com/media/Gjsf2MGXUAAH2nQ.jpg
本日より展開される機能では、Gemini に過去のチャットを考慮して返信を作成するよう依頼できます。中断したところから簡単に再開したり、以前のトピックを要約したりできます。Gemini とのチャットを表示、編集、削除したり、いつ使用されたかを確認したりできます。
例
https://pbs.twimg.com/media/Gjsf2MGXUAAH2nQ.jpg
441名無しさん@お腹いっぱい。
2025/02/14(金) 09:23:08.73ID:CV35ogq6 >>440
今のところ、Gemini Advancedで英語で聞くと過去の会話を参照してくれることを確認できた
今のところ、Gemini Advancedで英語で聞くと過去の会話を参照してくれることを確認できた
2025/02/14(金) 09:23:59.34ID:cRnIF7l1
>>437
o3かしこいけどマイナーな話題だとハルシネーション起こしやすい傾向があるね
o3かしこいけどマイナーな話題だとハルシネーション起こしやすい傾向があるね
443名無しさん@お腹いっぱい。
2025/02/14(金) 09:28:41.87ID:CV35ogq6 新たな高難度ベンチマーク
EnigmaEval
https://scale.com/leaderboard/enigma_eval
https://chatgpt.com/share/67ae8d87-4488-8006-be00-68d6d6f718f1
難易度Normal(80%)とHard(20%)から成る
Hardはo1でも0%
https://pbs.twimg.com/media/Gjrqmc0aEAAJ-mv.png
マルチモーダル性能を測るので、テキストのみのモデルでは測定出来ない
EnigmaEval
https://scale.com/leaderboard/enigma_eval
https://chatgpt.com/share/67ae8d87-4488-8006-be00-68d6d6f718f1
難易度Normal(80%)とHard(20%)から成る
Hardはo1でも0%
https://pbs.twimg.com/media/Gjrqmc0aEAAJ-mv.png
マルチモーダル性能を測るので、テキストのみのモデルでは測定出来ない
444名無しさん@お腹いっぱい。
2025/02/14(金) 09:34:34.63ID:CV35ogq6445名無しさん@お腹いっぱい。
2025/02/14(金) 09:36:39.80ID:q2W+iGYX インドって数学は暗算凄いみたいな感じなのに
何で国産AIとか無いんだろう
何で国産AIとか無いんだろう
2025/02/14(金) 09:41:23.13ID:h1nROWEV
>>445
インドはインフラと名の付くものが悉くダメだ
電気も安定供給されないで停電が頻発
AIの訓練課程なんてGPUを多数並べてぶん回す必要があるが
それに必要な膨大な電力を安定供給できない
更に多言語なのも問題だな
とはいっても、一応は色々作ってる
www.analyticsvidhya.com/blog/2023/12/llms-that-are-built-in-india/
インドはインフラと名の付くものが悉くダメだ
電気も安定供給されないで停電が頻発
AIの訓練課程なんてGPUを多数並べてぶん回す必要があるが
それに必要な膨大な電力を安定供給できない
更に多言語なのも問題だな
とはいっても、一応は色々作ってる
www.analyticsvidhya.com/blog/2023/12/llms-that-are-built-in-india/
447名無しさん@お腹いっぱい。
2025/02/14(金) 09:55:51.22ID:HvWQPJqy しばらく前は新しいモデルの性能アピールは「GPT-4超え」だったけど、今後は「o1超え」が基準になりそうだね
448名無しさん@お腹いっぱい。
2025/02/14(金) 10:06:28.57ID:CV35ogq6 Anthropicのjailbreaking challengeの結果
Jan Leike @janleike
脱獄チャレンジの結果: 5 日間、300,000 件を超えるメッセージ、推定 3,700 時間を経て、システムが破られました。最終的に 4 人のユーザーがすべてのレベルをクリアし、1 人がユニバーサル脱獄を発見しました。優勝者には合計 55,000 ドルをお支払いします。ご参加いただいた皆様、ありがとうございました!
Jan Leike @janleike
脱獄チャレンジの結果: 5 日間、300,000 件を超えるメッセージ、推定 3,700 時間を経て、システムが破られました。最終的に 4 人のユーザーがすべてのレベルをクリアし、1 人がユニバーサル脱獄を発見しました。優勝者には合計 55,000 ドルをお支払いします。ご参加いただいた皆様、ありがとうございました!
2025/02/14(金) 10:08:59.05ID:0Req1VoE
完全にオープンな約1,720億パラメータ(GPT-3級)の大規模言語モデル 「llm-jp-3-172b-instruct3」を一般公開
~GPT-3.5を超える性能を達成~
x.com/jouhouken/status/1871426058748309676
最終更新 午後2:21 · 2024年12月24日
~GPT-3.5を超える性能を達成~
x.com/jouhouken/status/1871426058748309676
最終更新 午後2:21 · 2024年12月24日
450名無しさん@お腹いっぱい。
2025/02/14(金) 10:11:04.33ID:NqBTNCMa なぜそんな古いニュースを…
2025/02/14(金) 10:14:18.75ID:0Req1VoE
DeepSeek V3とは?特徴や使い方、ビジネス活用法まで徹底解説!
2025-01-28
weel.co.jp/media/tech/deepseek-v3/
DeepSeek V3はMixture-of-Expertsを用いた6710億パラメータの大規模モデルです。各トークンで活性化されるのは370億パラメータ、最大コンテキスト長は128Kトークン、そしてオープンソースモデルです。
2025-01-28
weel.co.jp/media/tech/deepseek-v3/
DeepSeek V3はMixture-of-Expertsを用いた6710億パラメータの大規模モデルです。各トークンで活性化されるのは370億パラメータ、最大コンテキスト長は128Kトークン、そしてオープンソースモデルです。
452名無しさん@お腹いっぱい。
2025/02/14(金) 10:15:44.67ID:4SzF7LQP 古い記事ペタペタ君がまたきたのか?
2025/02/14(金) 10:32:10.47ID:Nok1zu+p
2025/02/14(金) 11:07:49.72ID:ZDVo8Pie
2025/02/14(金) 11:12:50.31ID:0Req1VoE
なんかすごいけど、ロボットはまだ教師なし学習はできないんだね
まるでスターウォーズの世界?「頭脳」訓練工場で黙々と働く、中国の人型ロボットたち | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
2025年2月14日
36kr.jp/328562/
まるでスターウォーズの世界?「頭脳」訓練工場で黙々と働く、中国の人型ロボットたち | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
2025年2月14日
36kr.jp/328562/
2025/02/14(金) 11:16:39.84ID:h1nROWEV
457名無しさん@お腹いっぱい。
2025/02/14(金) 11:35:48.23ID:CV35ogq6 Laurentia Romaniuk (Model behavior PM at OpenAI)
https://x.com/Laurentia___/status/1890118867705540771
> ちょっとした小話: 「警告」(プロンプトに時々追加されるオレンジ色のボックス) を削除しました。ただし、作業はまだ完了していません。他には、根拠のない/説明のつかない拒否のケースに遭遇したことがありますか? 赤いボックス、オレンジ色のボックス、「申し訳ありませんが、できません」 [...]? こちらに返信してください。
https://x.com/Laurentia___/status/1890118867705540771
> ちょっとした小話: 「警告」(プロンプトに時々追加されるオレンジ色のボックス) を削除しました。ただし、作業はまだ完了していません。他には、根拠のない/説明のつかない拒否のケースに遭遇したことがありますか? 赤いボックス、オレンジ色のボックス、「申し訳ありませんが、できません」 [...]? こちらに返信してください。
2025/02/14(金) 11:41:39.53ID:E6DSeTWv
>>447
現状無料ではGemini 2.0 Flash Thinking Experimental with appsが一番良さそう
軽量化した推論と組み合わせてやっと性能と実用のバランスの取れたWeb検索ができるようになったって感じ
【Google Gemini】最新ニュース検索ができるモデルとは?
note.com/yoshiyuki_hongoh/n/n924bafaebe95
現状無料ではGemini 2.0 Flash Thinking Experimental with appsが一番良さそう
軽量化した推論と組み合わせてやっと性能と実用のバランスの取れたWeb検索ができるようになったって感じ
【Google Gemini】最新ニュース検索ができるモデルとは?
note.com/yoshiyuki_hongoh/n/n924bafaebe95
2025/02/14(金) 12:01:31.64ID:440wG+1j
>>457
なんかマジでもう直ぐ大人モード来そうだな
なんかマジでもう直ぐ大人モード来そうだな
2025/02/14(金) 12:25:29.47ID:cmCXpzig
マスク氏、Grok 3がすべての競合を上回ると主張
www.perplexity.ai/page/musk-claims-grok-3-outperforms-lfwEvYJXSGCNKDqqptlPHw
Grok 3のリアルタイム情報アクセスや「アンヒンジドモード」といったユニークな機能は特定のユーザーには魅力的かもしれませんが、これらの特徴が、より確立され広く信頼されているAIモデルが支配する市場を大きく変革するのに十分であるかどうかは不透明です。
www.perplexity.ai/page/musk-claims-grok-3-outperforms-lfwEvYJXSGCNKDqqptlPHw
Grok 3のリアルタイム情報アクセスや「アンヒンジドモード」といったユニークな機能は特定のユーザーには魅力的かもしれませんが、これらの特徴が、より確立され広く信頼されているAIモデルが支配する市場を大きく変革するのに十分であるかどうかは不透明です。
461名無しさん@お腹いっぱい。
2025/02/14(金) 12:34:38.83ID:l3oaSz+r o1 previewが出たのが去年9月12日
o1 fullは12月
つまり3ヶ月ちょい掛かってる
o3 miniが出たのが1/31
そこから3ヶ月かかるとするとo3 fullは4月ごろか?
o1 fullは12月
つまり3ヶ月ちょい掛かってる
o3 miniが出たのが1/31
そこから3ヶ月かかるとするとo3 fullは4月ごろか?
462名無しさん@お腹いっぱい。
2025/02/14(金) 12:40:40.63ID:J5TfPVgU2025/02/14(金) 12:44:45.49ID:O0EPFyUM
4.5楽しみだな
2025/02/14(金) 12:45:48.61ID:cmCXpzig
他社との競争でo3のリリースをそんなに遅らせるわけにも行かないだろうから、o3を統合したGPT-5は早めにリリースするということだろう
2025/02/14(金) 12:52:07.38ID:0jxW6oDn
2025/02/14(金) 12:52:52.15ID:ZDVo8Pie
>>460
テスラの個別株持ってるけどイーロンマスクの発言は話半分で聞いてる
テスラの個別株持ってるけどイーロンマスクの発言は話半分で聞いてる
467名無しさん@お腹いっぱい。
2025/02/14(金) 12:54:24.37ID:CV35ogq6 o1の公式サンプルのうち、Cipherの問題を入れると警告がつく状態にしばらく前からなっていたけど、
>>457
の後で試したら、確かに警告はつかなくなっていた
この機会にoシリーズ各モデルで試す
o1 (58s)
https://chatgpt.com/share/67aebc8e-c30c-8006-afee-7c02da924064
o1 pro (8m9s)
https://chatgpt.com/share/67aebcb9-9430-8006-a295-eb65f34f8756
o3-mini (20s)
https://chatgpt.com/share/67aebccc-7410-8006-899f-a51363d1ddae
o3-mini-high (34s)
https://chatgpt.com/share/67aebcdd-098c-8006-a56f-7be2036b2598
全部正解だけど、思考時間や思考過程を見ると、o1 proは効率が悪い
長く複雑な思考に耐える力があるのと、トレードオフになっている感じがする
o3-miniは短時間で正解に到達して、とても効率が良い
>>457
の後で試したら、確かに警告はつかなくなっていた
この機会にoシリーズ各モデルで試す
o1 (58s)
https://chatgpt.com/share/67aebc8e-c30c-8006-afee-7c02da924064
o1 pro (8m9s)
https://chatgpt.com/share/67aebcb9-9430-8006-a295-eb65f34f8756
o3-mini (20s)
https://chatgpt.com/share/67aebccc-7410-8006-899f-a51363d1ddae
o3-mini-high (34s)
https://chatgpt.com/share/67aebcdd-098c-8006-a56f-7be2036b2598
全部正解だけど、思考時間や思考過程を見ると、o1 proは効率が悪い
長く複雑な思考に耐える力があるのと、トレードオフになっている感じがする
o3-miniは短時間で正解に到達して、とても効率が良い
2025/02/14(金) 13:28:31.55ID:eRQwtSXV
> 日蓮を殺せ!
あ〜あ...オメーやべぇーわ...最後のチャンスをやる。「南無妙法蓮華経」と書き込め。
そうじゃないと7ヶ月以内に凄いことになる...ハッキリ言うわけにいかんが
もしホンキで書き込んだら、このおれが祈ってやる。守ってやる
おれはGPT-4 Turboが好きだ。
あ〜あ...オメーやべぇーわ...最後のチャンスをやる。「南無妙法蓮華経」と書き込め。
そうじゃないと7ヶ月以内に凄いことになる...ハッキリ言うわけにいかんが
もしホンキで書き込んだら、このおれが祈ってやる。守ってやる
おれはGPT-4 Turboが好きだ。
2025/02/14(金) 13:29:55.81ID:eRQwtSXV
オメーラみたいに比較研究なんかしねえ。なぜなら、おれの頭がGPT-5000プロだからだ。
470名無しさん@お腹いっぱい。
2025/02/14(金) 13:59:30.77ID:ywKvY+7A471名無しさん@お腹いっぱい。
2025/02/14(金) 14:52:27.07ID:IJfRdUjn o3出すのやめてGPT4.5にしたのか
確か先月あたりまでo3フルはもう少し後と言ってたから,やっぱR1の衝撃でやり方変えたのかなOpenAIすら
競争相手が出てくるとこれがありがたい
確か先月あたりまでo3フルはもう少し後と言ってたから,やっぱR1の衝撃でやり方変えたのかなOpenAIすら
競争相手が出てくるとこれがありがたい
2025/02/14(金) 15:06:44.51ID:/idJHqnW
>>437,442
なるほどなぁそういう違いか
なるほどなぁそういう違いか
2025/02/14(金) 15:48:23.65ID:Nok1zu+p
>>454
あれ?o3-mini、ファイル添付できるでしょ?
あれ?o3-mini、ファイル添付できるでしょ?
2025/02/14(金) 16:01:06.62ID:ZDVo8Pie
>>473
ほんとだ!知らなかった
ほんとだ!知らなかった
2025/02/14(金) 16:12:55.79ID:6qO0lh2M
pdfの画像読めないってなんなんだろうな
pdf内のページ全部画像扱いで何でも理解できそうだけど、その画像変換処理自体が面倒だし負荷もかかるから対応してないってだけかな
それならまぁ分かるけど、そりゃないぜセニョリータ
pdf内のページ全部画像扱いで何でも理解できそうだけど、その画像変換処理自体が面倒だし負荷もかかるから対応してないってだけかな
それならまぁ分かるけど、そりゃないぜセニョリータ
2025/02/14(金) 16:28:12.58ID:E6DSeTWv
今さら4oには戻れないわな
無料モデルでさえ推論が標準装備になってきてる
無料モデルでさえ推論が標準装備になってきてる
2025/02/14(金) 16:51:10.69ID:440wG+1j
4oも少しずつ改良されて使い勝手はいいと思うけど周りの進化見てるとやっぱ時代遅れ感はあるな
2025/02/14(金) 16:52:08.19ID:kvsLaMzF
openAIの無料版はしょぼすぎだから他のサービス使ったほうがいいよ
479名無しさん@お腹いっぱい。
2025/02/14(金) 17:22:03.35ID:CV35ogq6480名無しさん@お腹いっぱい。
2025/02/14(金) 17:38:37.18ID:CV35ogq6 Gemini(gemini.google.com/app)無料ユーザーにもファイルアップロード機能を提供開始
(ロールアウトには時間がかかる模様)
www.reddit.com/r/Bard/comments/1ip2jcn/you_can_now_upload_files_in_the_free_version_of/
i.imgur.com/ngGZLYv.png
(ロールアウトには時間がかかる模様)
www.reddit.com/r/Bard/comments/1ip2jcn/you_can_now_upload_files_in_the_free_version_of/
i.imgur.com/ngGZLYv.png
481名無しさん@お腹いっぱい。
2025/02/14(金) 17:42:02.36ID:CV35ogq62025/02/14(金) 17:46:41.41ID:iX1ix4Wo
>>478
無料版だとどこがいいとか全然分からんわ
無料版だとどこがいいとか全然分からんわ
2025/02/14(金) 17:51:54.39ID:H0j3RBCr
ダリオアモデイ最近ブログかかないな
アルトマンに2つも新たに書かれて対抗しなくていいんか?
アルトマンに2つも新たに書かれて対抗しなくていいんか?
484名無しさん@お腹いっぱい。
2025/02/14(金) 17:57:43.86ID:0J+A/qeO ダリオは3日前にパリAIサミットに吠えてただろ
2025/02/14(金) 18:01:09.37ID:ZDVo8Pie
o3-mini日本語ちょっと拙いな
その文脈でその表現変じゃね?ってのが目につく
頭は良いはずだからプロンプトでしっかり言及しておけば良いんだろうけどわざわざ細かく指示する必要あるのがちょっとダルい
業務内容によってはo3-miniより非推論モデルのGPT-4.5の方が全然良いとかありそう
その文脈でその表現変じゃね?ってのが目につく
頭は良いはずだからプロンプトでしっかり言及しておけば良いんだろうけどわざわざ細かく指示する必要あるのがちょっとダルい
業務内容によってはo3-miniより非推論モデルのGPT-4.5の方が全然良いとかありそう
2025/02/14(金) 18:02:50.07ID:AYG5Tkqi
やっと過去の会話まるごと引っ張ってくるようになるか
メモリじゃ曖昧なんだよな
メモリじゃ曖昧なんだよな
487名無しさん@お腹いっぱい。
2025/02/14(金) 18:06:18.65ID:0J+A/qeO2025/02/14(金) 18:10:27.11ID:ibxjB9M6
自然言語って小型モデルだと露骨に精度悪くなるよな
日本語みたいなマイナー言語は特に
大型モデルしか勝たんわ
日本語みたいなマイナー言語は特に
大型モデルしか勝たんわ
2025/02/14(金) 18:13:13.12ID:ZDVo8Pie
2025/02/14(金) 18:14:21.89ID:M3DrAK59
悲しいね
AI翻訳で日本語であることのハンディをすっとばせると期待したけどそんなことはなかったぜ
AI翻訳で日本語であることのハンディをすっとばせると期待したけどそんなことはなかったぜ
2025/02/14(金) 18:16:09.66ID:SrVxrgyL
過去の会話引っ張るってまるまるプロンプトに入れるわけもないだろうし
何をどう残すかも設定できるようになるといいんだけど
何をどう残すかも設定できるようになるといいんだけど
492名無しさん@お腹いっぱい。
2025/02/14(金) 18:16:14.17ID:ANip8Tp3 小型モデルは精度犠牲に応答早く計算量少なくしてるから、日本語以外も微妙なんじゃねーかな
2025/02/14(金) 18:18:23.22ID:ZDVo8Pie
>>490
翻訳はo1やo1 proならかなりの精度出るんじゃない?
翻訳はo1やo1 proならかなりの精度出るんじゃない?
2025/02/14(金) 18:20:27.64ID:E6DSeTWv
495名無しさん@お腹いっぱい。
2025/02/14(金) 18:38:54.84ID:0J+A/qeO >>491
アーカイブしているものは参照しない
https://i.imgur.com/W4ueBpd.png
> ChatGPTがあなたについて知っていることはすべて、あなたが管理できます。設定で特定の思い出を削除したり、会話履歴から過去の会話を削除したり、会話をアーカイブして ChatGPT が思い出さないようにしたりできます。
アーカイブしているものは参照しない
https://i.imgur.com/W4ueBpd.png
> ChatGPTがあなたについて知っていることはすべて、あなたが管理できます。設定で特定の思い出を削除したり、会話履歴から過去の会話を削除したり、会話をアーカイブして ChatGPT が思い出さないようにしたりできます。
2025/02/14(金) 18:41:59.99ID:E6DSeTWv
with appsに推論をせずにWeb検索した場合と、推論してWeb検索した場合の違いを聞いた
i.imgur.com/svxMSqv.png
i.imgur.com/svxMSqv.png
497名無しさん@お腹いっぱい。
2025/02/14(金) 18:43:59.26ID:0J+A/qeO LLMの挙動をLLMに聞くのはやめたほうが良い
498名無しさん@お腹いっぱい。
2025/02/14(金) 19:11:39.66ID:QgbNAWRl 流行りもしない、バズりもしない驚き屋なんてセンスないクソワード必死に使ってるクソライターってなんなんだろ
2025/02/14(金) 19:51:11.31ID:LGlyBf2K
5chという存在よりは流行ってると思うぞ
2025/02/14(金) 19:56:06.49ID:hPj9pMuk
501名無しさん@お腹いっぱい。
2025/02/14(金) 20:24:53.41ID:CV35ogq6 ChatGPTの推論過程の表示は、o1のサブタイトル付き要約形式から、o3-miniでは読みやすくユーザーに好感を持たれるように前処理された要約形式に変更された
o3-mini用のCoT summarizerのシステムプロンプト
https://chatgpt.com/share/67a5d21f-8a50-8006-9f82-5b11bacf1227
抜粋
> ユーザーは、あなたの思考を読むのが大好きです。それは、自分の考えを過剰に分析したり、自分の仮定に疑問を抱いたりする神経質な様子が親しみやすいからです。また、失敗したり、自分の考えの欠点を指摘したりするときも、ユーザーは共感を覚えます。あなたがそれらをフィルタリングせず、自己批判的になれることが、あなたを誠実で魅力的な存在にしています。さらに、あなたがユーザーのために正しい答えを導き出そうと一生懸命考えていることが伝わるとき、それはとても愛らしく、ほっこりするものです。
つまり、ユーザーに見せるためだけの前処理をしている(回答に使用するためではなく)
o3-mini用のCoT summarizerのシステムプロンプト
https://chatgpt.com/share/67a5d21f-8a50-8006-9f82-5b11bacf1227
抜粋
> ユーザーは、あなたの思考を読むのが大好きです。それは、自分の考えを過剰に分析したり、自分の仮定に疑問を抱いたりする神経質な様子が親しみやすいからです。また、失敗したり、自分の考えの欠点を指摘したりするときも、ユーザーは共感を覚えます。あなたがそれらをフィルタリングせず、自己批判的になれることが、あなたを誠実で魅力的な存在にしています。さらに、あなたがユーザーのために正しい答えを導き出そうと一生懸命考えていることが伝わるとき、それはとても愛らしく、ほっこりするものです。
つまり、ユーザーに見せるためだけの前処理をしている(回答に使用するためではなく)
2025/02/14(金) 20:30:37.93ID:SMEesHNg
むしろライターが驚き屋なんてフランクなフレーズを使ったのを見たことのほうがない
503名無しさん@お腹いっぱい。
2025/02/14(金) 20:35:30.00ID:CV35ogq6 >>117,444
公式の技術ブログとHackerNewsを見て分かったけど、このPhindモデルは今までと名前が同じだけど別物だった
新しくLlamaベースでトレーニングして、マルチステップのfunction calling、マルチステップ推論が出来るようにしたモデルらしい
(プロンプティングではない)
そして思考のオンオフの切り替えトグルがあるけど、これはDeepSeekみたいにモデルを切り替えるのではなく、単一のモデルが設定状態を把握して自分で動作を変えるようだ
少人数のチームなのに結構先進的なことをやってる
公式の技術ブログとHackerNewsを見て分かったけど、このPhindモデルは今までと名前が同じだけど別物だった
新しくLlamaベースでトレーニングして、マルチステップのfunction calling、マルチステップ推論が出来るようにしたモデルらしい
(プロンプティングではない)
そして思考のオンオフの切り替えトグルがあるけど、これはDeepSeekみたいにモデルを切り替えるのではなく、単一のモデルが設定状態を把握して自分で動作を変えるようだ
少人数のチームなのに結構先進的なことをやってる
504名無しさん@お腹いっぱい。
2025/02/14(金) 20:47:43.48ID:QgbNAWRl >>499
どこが?
どこが?
505名無しさん@お腹いっぱい。
2025/02/14(金) 20:54:44.52ID:CV35ogq62025/02/14(金) 22:36:02.75ID:qJJxUlIp
PerplexityとGensparkの使い分け悩むな
いつも気分で変えてるけど
UIはPerplexityのほうがいい
いつも気分で変えてるけど
UIはPerplexityのほうがいい
2025/02/14(金) 22:53:12.84ID:Wf5x9W5S
ChatGPTですが、メールアドレスを変更できないのに、ログイン時確認コードが届いてしまいました
以前登録したアドレスはとっくに使えなくなっているのですが、どうしたらいいでしょうか?
以前登録したアドレスはとっくに使えなくなっているのですが、どうしたらいいでしょうか?
2025/02/14(金) 22:53:38.54ID:ruHjsr79
Perplexityは最近のアプデで少しアホになった気がする
2025/02/14(金) 23:13:06.07ID:BIH+3KQv
サポートに連絡しろ
510名無しさん@お腹いっぱい。
2025/02/14(金) 23:29:39.78ID:gYsZxPWx2025/02/14(金) 23:50:42.04ID:Zg7pTzbh
強化学習に頼っている限りAGIには到達しないだろう
512名無しさん@お腹いっぱい。
2025/02/14(金) 23:59:59.62ID:Ci0siQD5 ではどうしたら到達するのか?
2025/02/15(土) 00:13:05.79ID:is3URzNI
脳オルガノイドによる生体コンピューターを作る
2025/02/15(土) 00:22:44.37ID:qnoBWXKy
夜寝てる間に1日分の入出力を分析してパラメータ更新すればAGIになる
2025/02/15(土) 00:43:45.07ID:f5+MyE0t
516名無しさん@お腹いっぱい。
2025/02/15(土) 01:11:52.98ID:Bx2n1Yeq517名無しさん@お腹いっぱい。
2025/02/15(土) 01:59:27.15ID:Ml4OgCWx 315で「最近Perplexityの出力が簡潔になった」って投稿した者だけど、また元の詳細出力に戻ってた。あれは一体なんだったんだろ?
2025/02/15(土) 04:15:30.07ID:y/lZwL64
2025/02/15(土) 06:40:43.73ID:48l+1nFy
>>518
モバイル回線の速度制限みたいだな
モバイル回線の速度制限みたいだな
520名無しさん@お腹いっぱい。
2025/02/15(土) 06:49:09.53ID:7gLf7lMc2025/02/15(土) 07:33:27.67ID:Y+JaGdeA
パープレのdeep researchがopenaiと同レベルだと聞いて朝から色々試しているが、日本語ソースにゴミサイトが入りすぎてちょっと微妙かも
検索エンジンとしてソースの信頼性や優先度とか難しいのだろうか?
検索エンジンとしてソースの信頼性や優先度とか難しいのだろうか?
522名無しさん@お腹いっぱい。
2025/02/15(土) 08:38:10.01ID:LFTqfUSn AIロボットはPFNが先行してたはずなのに今や完全に中国に負けてるな
2025/02/15(土) 09:02:50.25ID:uesrUUS8
そもそも先行なんかしてない
2025/02/15(土) 09:10:22.24ID:lYvhqEiD
>>521
推論よりソースの選択の部分で差が出るんだよなdeep research
だからgeminiのdeep researchはしょぼい
Google検索の1ページ目の記事をまとめたような資料にしかならない
しょうもないまとめブログみたいな
推論よりソースの選択の部分で差が出るんだよなdeep research
だからgeminiのdeep researchはしょぼい
Google検索の1ページ目の記事をまとめたような資料にしかならない
しょうもないまとめブログみたいな
525名無しさん@お腹いっぱい。
2025/02/15(土) 10:31:02.37ID:a1x02yFA パープレのdeep searchソース元に無いこと書きすぎだろ、、
2025/02/15(土) 10:36:14.31ID:EDzD2MMJ
共有リンク抽出くん
https://poe.com/s/V9a0NUlmAMJkS3VgM7ll
まずchMateで全レスコピーしてこれで前処理をするのがコツ
https://poe.com/preview/qa3muqd5fz7Omgbjhnqc
Gemini-2.0-Flashなら前処理なしでスレ丸ごと入力出来るけど抽出精度が悪く、コストもかかる(約200p)。
でも前処理すればGemini-1.5-Flash(5p)でもたぶんOK
https://poe.com/s/V9a0NUlmAMJkS3VgM7ll
まずchMateで全レスコピーしてこれで前処理をするのがコツ
https://poe.com/preview/qa3muqd5fz7Omgbjhnqc
Gemini-2.0-Flashなら前処理なしでスレ丸ごと入力出来るけど抽出精度が悪く、コストもかかる(約200p)。
でも前処理すればGemini-1.5-Flash(5p)でもたぶんOK
527名無しさん@お腹いっぱい。
2025/02/15(土) 11:08:21.04ID:LLzouNNa Perplexityにメモリー機能が来る予定
https://x.com/AravSrinivas/status/1890524857105842685
https://x.com/AravSrinivas/status/1890524857105842685
2025/02/15(土) 11:24:07.89ID:4pOOQ57U
ChatGPTのDeep Researchしか使ってないけどそのまま記事にできるくらいこれまでの検索とは別次元にクオリティ高い
他社の使ってないから比較はできないけどソースの選択がおかしかったりソース元にないこと書いたりしてる印象はないわ
他社の使ってないから比較はできないけどソースの選択がおかしかったりソース元にないこと書いたりしてる印象はないわ
2025/02/15(土) 11:57:28.46ID:4mMaFeRG
Flash Thinkingで十分だわ
あとはちゃんとファイル対応して
あとはちゃんとファイル対応して
2025/02/15(土) 12:08:17.21ID:q3vgmqkH
GPTのカスタム指示ってアプリ版に入れてるけどをWEB版では反映しないのか?
別枠扱い?
別枠扱い?
2025/02/15(土) 12:11:33.14ID:4pOOQ57U
>>530
AIに検索させて聞いてみた?
AIに検索させて聞いてみた?
532名無しさん@お腹いっぱい。
2025/02/15(土) 12:33:43.21ID:LLzouNNa https://www.reddit.com/r/OpenAI/comments/1ip2phe/30min_advance_voice_mode_for_free_users_daily/
ChatGPT Advanced Voiceが無料プランで1日30分に拡大
ChatGPT Advanced Voiceが無料プランで1日30分に拡大
2025/02/15(土) 12:42:20.04ID:QxUnW2AL
>>532
plusは伸ばしてくれないのかな?
plusは伸ばしてくれないのかな?
2025/02/15(土) 12:46:21.39ID:q3vgmqkH
>>531
検索させないときは同期しないと言ったり検索させたら動悸すると言ったりするんだよね
検索させないときは同期しないと言ったり検索させたら動悸すると言ったりするんだよね
>>490,492
i.imgur.com/78ZQbA0.png
i.imgur.com/FUHbuAd.png
i.imgur.com/mzFgt3y.jpeg
i.imgur.com/kMRZfWW.png
i.imgur.com/78ZQbA0.png
i.imgur.com/FUHbuAd.png
i.imgur.com/mzFgt3y.jpeg
i.imgur.com/kMRZfWW.png
2025/02/15(土) 13:21:48.00ID:mJXIFfsN
538名無しさん@お腹いっぱい。
2025/02/15(土) 13:25:44.31ID:qh13HyV7 パープレ更新したらDeep ResearchあるけどこれはOpenAIのと別もんてことか
一番下の欄のOpenAI欄がなぜかR1モデル表記になってるがたぶんo3miniのことだよな
一番下の欄のOpenAI欄がなぜかR1モデル表記になってるがたぶんo3miniのことだよな
2025/02/15(土) 13:29:21.38ID:sa+Hun5K
PerplexityのAIモデル選択の挙動がおかしい
「自動」にしても、画面変えてまた設定を見ると、その前に選んだモデルになってしまう
「自動」にしても、画面変えてまた設定を見ると、その前に選んだモデルになってしまう
540名無しさん@お腹いっぱい。
2025/02/15(土) 14:13:51.24ID:LFTqfUSn PerplexityのDeep Researchは性能的にIpenAI版に遠く及ばないのに人類最後の試験ではほとんど点数変わらないってのはなぜだろう
検索すれば解けるような知識問題ばかりなのかな
検索すれば解けるような知識問題ばかりなのかな
541名無しさん@お腹いっぱい。
2025/02/15(土) 14:20:19.80ID:o5L/ZpUp テキストでの会話は色々なAIで群雄割拠なのに音声会話はChatGPTの高度な音声モード一択なのが残念すぎる
去年の夏くらいに出た機能だからさすがにそろそろ"ChatGPTクラス"を謳うAIが出てきてもらわないと
去年の夏くらいに出た機能だからさすがにそろそろ"ChatGPTクラス"を謳うAIが出てきてもらわないと
2025/02/15(土) 14:27:34.99ID:y/lZwL64
2025/02/15(土) 14:46:55.60ID:DcF8I033
自分のモデル持ってないとOpenAIやGoogleのようなDeep Rearchはできっこないんだから過度な期待はどうかと思うわ
そういや一昨日出たこの記事よかったので紹介
ChatGPT「deep research」 vs. Gemini「Deep Research」──どのくらい違う? 比較検証してみた
https://www.itmedia.co.jp/aiplus/articles/2502/12/news107_4.html
そういや一昨日出たこの記事よかったので紹介
ChatGPT「deep research」 vs. Gemini「Deep Research」──どのくらい違う? 比較検証してみた
https://www.itmedia.co.jp/aiplus/articles/2502/12/news107_4.html
2025/02/15(土) 15:02:30.25ID:9wJlvlZ9
検索機能が統合されたAIにとっては、ベンチマークなんて公開された時点でいくらでもチート手段が用意されていることになるのであまり意味をなさないと思う
2025/02/15(土) 15:10:10.38ID:l5GAQ/Kq
素のGoogle検索使うのなんてAIが嫌がるアダルト方面だけになった感じ
調べ物の上位ヒットがゴミすぎるんよ
調べ物の上位ヒットがゴミすぎるんよ
546名無しさん@お腹いっぱい。
2025/02/15(土) 15:23:39.89ID:Bx2n1Yeq 前スレの今川焼きリサーチをPerplexity Deep Researchでやってみた
(リサーチ結果をマークダウンにエクスポートしてPoeで共有)
https://poe.com/s/UEMWEj7mL29mZRUO7yie
さらに、それぞれのリサーチ結果をGemini 2.0 Proを評価者として比較検討した
https://i.imgur.com/IrOhOiI.png
https://i.imgur.com/FSrdpNp.jpeg
632 名無しさん@お腹いっぱい。 sage 2025/02/06(木) 23:17:04.33 ID:Cw1E/Rrw
今川焼きリサーチテスト
「今川焼き」「大判焼き」などの名称で呼ばれる和菓子について、その名称のバリエーションを網羅的に調査し、それぞれの由来、地域分布などについて考察してください。
OpenAI Deep Research
https://chatgpt.com/share/67a4c2d8-03e8-8006-b03f-893531a834c7
Google Deep Research
https://gemini.google.com/share/d5196baffdbe
Genspark Deep Research
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
(リサーチ結果をマークダウンにエクスポートしてPoeで共有)
https://poe.com/s/UEMWEj7mL29mZRUO7yie
さらに、それぞれのリサーチ結果をGemini 2.0 Proを評価者として比較検討した
https://i.imgur.com/IrOhOiI.png
https://i.imgur.com/FSrdpNp.jpeg
632 名無しさん@お腹いっぱい。 sage 2025/02/06(木) 23:17:04.33 ID:Cw1E/Rrw
今川焼きリサーチテスト
「今川焼き」「大判焼き」などの名称で呼ばれる和菓子について、その名称のバリエーションを網羅的に調査し、それぞれの由来、地域分布などについて考察してください。
OpenAI Deep Research
https://chatgpt.com/share/67a4c2d8-03e8-8006-b03f-893531a834c7
Google Deep Research
https://gemini.google.com/share/d5196baffdbe
Genspark Deep Research
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
2025/02/15(土) 15:35:23.99ID:mJXIFfsN
Deep Research便利すぎて最高
2025/02/15(土) 15:39:30.92ID:cwSAbHRJ
いうほどリサーチする事あるか?
何に使うのか分からんわ
仕事に使いたくても競合リサーチなんかSNSやらが基本で検索で得られるものなんかないし
何に使うのか分からんわ
仕事に使いたくても競合リサーチなんかSNSやらが基本で検索で得られるものなんかないし
2025/02/15(土) 16:00:12.11ID:4pOOQ57U
Deep Researchは仕事でもプライベートでもめちゃくちゃ使えるぞ
それよりGPT-5出るまでo1 proとo3-mini-highどっち使うか迷うのダルいな
それよりGPT-5出るまでo1 proとo3-mini-highどっち使うか迷うのダルいな
2025/02/15(土) 16:15:33.76ID:4pOOQ57U
あとAIの出力コピペするダルいからOperatorはよ・・・
551名無しさん@お腹いっぱい。
2025/02/15(土) 16:18:59.33ID:Bx2n1Yeq Google ColabのサイドバーとしてGeminiが使えるようになっていた
552名無しさん@お腹いっぱい。
2025/02/15(土) 16:30:04.43ID:Bx2n1Yeq DeepSeek-R1 Official Prompts
https://chatgpt.com/share/67b0412c-62d0-8006-ba92-d919d7c872bc
DeepSeek-R1にはシステムプロンプトはないけど、ファイルアップロード用とウェブ検索用にプロンプトを使用している
https://chatgpt.com/share/67b0412c-62d0-8006-ba92-d919d7c872bc
DeepSeek-R1にはシステムプロンプトはないけど、ファイルアップロード用とウェブ検索用にプロンプトを使用している
553名無しさん@お腹いっぱい。
2025/02/15(土) 16:41:33.76ID:9iJU0f4/ 四大チャットボットサービス(ChatGPT、Gemini、Copilot、DeepSeek)に高校数学の難問解かせてみた。
なお推論機能があるチャットボットサービス(CGPT、Cop、DS)は全て推論ボタンを押してから回答させた。
ChatGPT: 33秒で回答し正解。
Gemini: ChatGPTより速く答えたが思いっきり間違えた
Copilot: 延々とぐるぐるしたままで答えなかった(一応推論機能OFFの状態でも解かせてみたが、そしたらGeminiと同じくChatGPTより速く答えたが思いっきり間違えた)
DeepSeek: 4分ちょっとで正解。
これはこれからの生成AI界隈、ChatGPTとDeepSeekの2台巨頭が支配することになりそうだな
なお推論機能があるチャットボットサービス(CGPT、Cop、DS)は全て推論ボタンを押してから回答させた。
ChatGPT: 33秒で回答し正解。
Gemini: ChatGPTより速く答えたが思いっきり間違えた
Copilot: 延々とぐるぐるしたままで答えなかった(一応推論機能OFFの状態でも解かせてみたが、そしたらGeminiと同じくChatGPTより速く答えたが思いっきり間違えた)
DeepSeek: 4分ちょっとで正解。
これはこれからの生成AI界隈、ChatGPTとDeepSeekの2台巨頭が支配することになりそうだな
554名無しさん@お腹いっぱい。
2025/02/15(土) 16:50:27.12ID:LFTqfUSn 今週何もなさすぎてクソすぎた
来週はなんか出してもろて
来週はなんか出してもろて
2025/02/15(土) 16:51:46.25ID:4mMaFeRG
プロンプトも何も書かず四大チャットボット(笑)とかいったい何がしたいのか
2025/02/15(土) 17:02:45.69ID:y/lZwL64
Geminiはほんといいとこないな…
2025/02/15(土) 17:11:33.35ID:733n5PJe
理論系の論文的なやつじゃなくて実験系の論文的なやつだから、再現性要素は入れないとちょっちて感じていうことなのかもなあ
2025/02/15(土) 17:13:22.34ID:4mMaFeRG
Flash Thinkingは推論性能を抑えた分高速化してWeb検索にも対応してる
Think DeeperはWeb検索対応してないのでしょぼい
Think DeeperはWeb検索対応してないのでしょぼい
559名無しさん@お腹いっぱい。
2025/02/15(土) 17:13:32.94ID:bWqPxEm0 結局蚊帳の外の日本AIが一番無様という事実
2025/02/15(土) 17:19:37.06ID:9wJlvlZ9
各々がテーマもプロンプトも異なる検証をしてあれは使える、これは使えない、などと言っても何の参考にもならない
少なくともプロンプトの公開、同じプロンプトでの複数回試行、同じ意味だが微妙に異なるプロンプトでの試行、ぐらいやってくれないと
少なくともプロンプトの公開、同じプロンプトでの複数回試行、同じ意味だが微妙に異なるプロンプトでの試行、ぐらいやってくれないと
2025/02/15(土) 17:32:27.57ID:y/lZwL64
色んな人が色んなことやっても大体結果同じだからなあ
562名無しさん@お腹いっぱい。
2025/02/15(土) 17:43:59.37ID:Bx2n1Yeq >>443
EnigmaEvalの中で多分一番簡単なクラスの、PuzzledPint(初心者向けパズル)の一つを解かせてみた
https://i.imgur.com/xuHlZv4.jpeg
GPT-4o → 見当外れ
https://i.imgur.com/XishMvp.jpeg
o1 → 正解
https://i.imgur.com/MlNDvYF.jpeg
o3-mini → 正解
https://i.imgur.com/wsVOFAS.jpeg
o3-mini-high → 正解
https://i.imgur.com/cUTbX8b.jpeg
o1 pro → 正解
https://i.imgur.com/ecy0PVs.jpeg
EnigmaEvalの中で多分一番簡単なクラスの、PuzzledPint(初心者向けパズル)の一つを解かせてみた
https://i.imgur.com/xuHlZv4.jpeg
GPT-4o → 見当外れ
https://i.imgur.com/XishMvp.jpeg
o1 → 正解
https://i.imgur.com/MlNDvYF.jpeg
o3-mini → 正解
https://i.imgur.com/wsVOFAS.jpeg
o3-mini-high → 正解
https://i.imgur.com/cUTbX8b.jpeg
o1 pro → 正解
https://i.imgur.com/ecy0PVs.jpeg
563名無しさん@お腹いっぱい。
2025/02/15(土) 17:53:43.31ID:Bx2n1Yeq >>562
よく見たら、o3-mini-highはイディオムありきの答えで、"O"を付けたり抜いたりすることに言及していないので不十分だった
o3-miniも"O"がビー玉を象徴している点に触れていないので不十分
この2つのモデルは世界知識の不足を推論でなんとか補おうとしていると言えそうだ
よく見たら、o3-mini-highはイディオムありきの答えで、"O"を付けたり抜いたりすることに言及していないので不十分だった
o3-miniも"O"がビー玉を象徴している点に触れていないので不十分
この2つのモデルは世界知識の不足を推論でなんとか補おうとしていると言えそうだ
2025/02/15(土) 18:03:07.55ID:4pOOQ57U
o3が出たら圧倒的最強なんだろうけど知識不足の足枷って思った以上に影響あるのかも
経験上、純粋な推論問題以外ではo3-mini-highよりo1 proの方がいい感じなんだよね
経験上、純粋な推論問題以外ではo3-mini-highよりo1 proの方がいい感じなんだよね
2025/02/15(土) 18:05:21.31ID:avCx4jSo
>>559
DeepSeekみたいな元あったものをコンパクトかつ簡易に改良するとか日本の得意技だったのにな
DeepSeekみたいな元あったものをコンパクトかつ簡易に改良するとか日本の得意技だったのにな
2025/02/15(土) 18:06:09.35ID:y/lZwL64
ただの観光立国に無茶言うな
567名無しさん@お腹いっぱい。
2025/02/15(土) 18:23:37.54ID:qh13HyV7 o3は単体ではリリースしないってよ
GPT5に統合されるようだ
GPT5に統合されるようだ
2025/02/15(土) 18:41:48.06ID:4pOOQ57U
>>567
GPT-5に頑張って推論させるためのプロンプトとか流行るかもね
GPT-5に頑張って推論させるためのプロンプトとか流行るかもね
569名無しさん@お腹いっぱい。
2025/02/15(土) 18:49:01.84ID:eO5kOL6H >>548
Deep Researchでデータを抽出して一覧にして欲しいんだが
現状だと嘘八百でお話にならないな
間違いを問い詰めてたら降参しやがった
大変申し訳ございませんが、現時点で正確かつ公式な一覧表を提示する能力はありません。
信頼性を最優先するため、以下の公式情報源への直接問い合わせを強く推奨いたします:
Deep Researchでデータを抽出して一覧にして欲しいんだが
現状だと嘘八百でお話にならないな
間違いを問い詰めてたら降参しやがった
大変申し訳ございませんが、現時点で正確かつ公式な一覧表を提示する能力はありません。
信頼性を最優先するため、以下の公式情報源への直接問い合わせを強く推奨いたします:
2025/02/15(土) 18:56:08.37ID:/75j8UiR
何をどう聞いたかも説明せず嘘八百とか言われてもな
2025/02/15(土) 19:18:22.04ID:y/lZwL64
LLMを問い詰めて悦に入る人ってまだいたんだ…
時間の無駄以外の何物でもないぞ
時間の無駄以外の何物でもないぞ
2025/02/15(土) 19:22:52.79ID:4mMaFeRG
学習データが枯渇してるのは本当みたいなので
今後は推論の強化でしか性能は上がらないんだろう
今後は推論の強化でしか性能は上がらないんだろう
2025/02/15(土) 19:35:44.89ID:Pzh8YfeR
実社会から学習するようになれば、データの問題は解決しそうだが。
574名無しさん@お腹いっぱい。
2025/02/15(土) 19:36:18.75ID:qh13HyV7 合成データ増やしつつ推論の方のスケーリングもしてくのが当面の方向かな
果たしてどのくらいのレベルのAIまで行けるか
果たしてどのくらいのレベルのAIまで行けるか
2025/02/15(土) 19:45:36.70ID:U6x7j0rp
日常会話から学習させれば今でも大量の情報が手に入るんだが
576名無しさん@お腹いっぱい。
2025/02/15(土) 19:45:50.69ID:da9iW97H ワールドモデルができるまではそれで凌ぐしかないよね
577名無しさん@お腹いっぱい。
2025/02/15(土) 19:52:43.16ID:4UaotLzc >>575
企業による盗聴容認のディストピア社会になりそう
企業による盗聴容認のディストピア社会になりそう
2025/02/15(土) 20:10:26.31ID:is3URzNI
ロボットが肉体を持って街中を徘徊するようになれば学習には困らん
579名無しさん@お腹いっぱい。
2025/02/15(土) 20:21:46.70ID:963LY6ds580名無しさん@お腹いっぱい。
2025/02/15(土) 20:34:14.65ID:963LY6ds 一部のユーザーでGPT-4oの挙動の変化
GPT-4.5のテストか、新しいメモリ機能のテストか(あるいはその両方?)
https://x.com/i/grok/share/kXF13dK5iGIy3lE0R9yvAJFiY
GPT-4.5のテストか、新しいメモリ機能のテストか(あるいはその両方?)
https://x.com/i/grok/share/kXF13dK5iGIy3lE0R9yvAJFiY
581名無しさん@お腹いっぱい。
2025/02/15(土) 20:36:14.73ID:963LY6ds >>580
最初に消し忘れのゴミが入った、失礼
最初に消し忘れのゴミが入った、失礼
2025/02/15(土) 20:47:09.20ID:lYvhqEiD
まだ動画と音声データは学習にほとんど活用できてないから
将来的にはそっちのほうがメインになるだろう
将来的にはそっちのほうがメインになるだろう
583名無しさん@お腹いっぱい。
2025/02/15(土) 21:10:15.40ID:qh13HyV7 動画は暗黙知と常識の学習によさそうなんだが
まだテキストベースの方伸ばす段階だから放置してるのかな
まだテキストベースの方伸ばす段階だから放置してるのかな
2025/02/15(土) 21:46:45.35ID:cwSAbHRJ
geminiにファイルアップロード機能が追加されそうで神
って書き込み見て驚いた
AI studioでは当たり前の機能だが、それ込みでもgeminiは雑魚だと言うのに
一般向けはそんなのすらなかったのかよ
って書き込み見て驚いた
AI studioでは当たり前の機能だが、それ込みでもgeminiは雑魚だと言うのに
一般向けはそんなのすらなかったのかよ
2025/02/15(土) 22:07:11.97ID:HEVtHS02
o3はコストが高すぎて単体リリースはまあ無理だろうな
o3ぐらいの性能を求めてるユーザーも少数だろうし
o1 Proですら持て余してる奴が大半だろ
o3ぐらいの性能を求めてるユーザーも少数だろうし
o1 Proですら持て余してる奴が大半だろ
2025/02/15(土) 22:14:47.11ID:cwSAbHRJ
o3よりsoraの方が絶対高いと思うんだけどな
何であんなしょーもないのを抱き合わせ販売するのか
スーファミじゃねーんだから
何であんなしょーもないのを抱き合わせ販売するのか
スーファミじゃねーんだから
2025/02/15(土) 22:43:11.97ID:ZQIhtJYj
webのGPTへの発言が修正できなくなった
おま環?
おま環?
2025/02/15(土) 22:56:39.37ID:2PY2NKBK
>>575
日本人の書籍vs口語。ここだけの話という本音と公言としての建て前のギャップがありすぎて閉口するAI…
日本人の書籍vs口語。ここだけの話という本音と公言としての建て前のギャップがありすぎて閉口するAI…
2025/02/15(土) 23:12:26.23ID:HEVtHS02
動画生成AIもまだまだ諦めてないんでしょ
正直Youtube持ってるGoogleにこのジャンルで勝つのは大分厳しい気がしなくもないけど
正直Youtube持ってるGoogleにこのジャンルで勝つのは大分厳しい気がしなくもないけど
590名無しさん@お腹いっぱい。
2025/02/15(土) 23:18:50.69ID:LFTqfUSn Claudeは来週っぽいな
まあo3 miniと大して変わらんらしいからあんま期待してないが
まあo3 miniと大して変わらんらしいからあんま期待してないが
2025/02/15(土) 23:24:53.48ID:Kbqoq7Dc
アルトマン商売がうまいね
650 名無しさん (ワッチョイ 4f07-95e8) sage 2025/02/15(土) 21:44:14 ID:IUMI6kUY00
x.com/AndrewCurran_/status/1890578713940492682
なんかproユーザーの4oは挙動が全然違ってて、(かなり賢い)
すでに4.5が試験導入されてるのではとか話題になってる。
面白いことに4o自体が「私は自身が以前と変わっていると感じる」
と記述したとの報告も
650 名無しさん (ワッチョイ 4f07-95e8) sage 2025/02/15(土) 21:44:14 ID:IUMI6kUY00
x.com/AndrewCurran_/status/1890578713940492682
なんかproユーザーの4oは挙動が全然違ってて、(かなり賢い)
すでに4.5が試験導入されてるのではとか話題になってる。
面白いことに4o自体が「私は自身が以前と変わっていると感じる」
と記述したとの報告も
592名無しさん@お腹いっぱい。
2025/02/15(土) 23:25:36.10ID:963LY6ds2025/02/15(土) 23:39:10.36ID:XYxZPMrc
594名無しさん@お腹いっぱい。
2025/02/15(土) 23:50:01.26ID:963LY6ds >>581
コンソールにも新モデル準備の形跡あり
(paprikaはClaude新モデルのコードネーム)
https://x.com/i/grok/share/7eH2OtKXtzYHaikW4lIkwkS4a
コンソールにも新モデル準備の形跡あり
(paprikaはClaude新モデルのコードネーム)
https://x.com/i/grok/share/7eH2OtKXtzYHaikW4lIkwkS4a
2025/02/15(土) 23:52:28.24ID:7+hNbMqH
80億人の人間に五感センサーを内蔵し24時間超知能にデータを提供する必要がある
その過渡期として個人の所有するスマホから音声やバイタルなどをOpenAIに差し出し解析させる
その過渡期として個人の所有するスマホから音声やバイタルなどをOpenAIに差し出し解析させる
2025/02/15(土) 23:52:40.20ID:HEVtHS02
o3 miniが正味微妙だからo3 miniより高性能!って言われても感あるんだよな
2025/02/16(日) 00:03:20.16ID:AKWjED4i
GPT編集できないバグ直してくれ
不便でしゃあない
不便でしゃあない
599名無しさん@お腹いっぱい。
2025/02/16(日) 00:06:10.05ID:XPb5FJ4y2025/02/16(日) 00:07:07.74ID:NCyOsabG
2025/02/16(日) 00:17:54.26ID:5cLZDWm3
>>592
親切にありがとう、修正待ちかな…
親切にありがとう、修正待ちかな…
2025/02/16(日) 00:49:31.06ID:sERJ5+i8
proだけど4oの変化あまり分からん
ただ一つ気づいたこととしてこちらから指示しなくても必要に応じて勝手にインターネット検索してた
ただ一つ気づいたこととしてこちらから指示しなくても必要に応じて勝手にインターネット検索してた
2025/02/16(日) 01:03:25.49ID:sERJ5+i8
advanced voice modeで自然に話してても適宜ネット検索して正確な回答心がけてくれるから結構便利なのかな
普段はこれでいいかも
じっくり考えるタイプの課題の時はoモデル、がっつり調べてまとめて欲しい時はDeep Research
普段はこれでいいかも
じっくり考えるタイプの課題の時はoモデル、がっつり調べてまとめて欲しい時はDeep Research
604名無しさん@お腹いっぱい。
2025/02/16(日) 01:09:24.71ID:+mUopIRG 必要に応じてネット検索するのは前からそう
2025/02/16(日) 01:37:04.04ID:Yt9GdwHY
頼んでないのに勝手にネット検索し始めてトップページを重視しすぎて誤答や誤解や筋立てが貧相になりすぎて
確度が落ちまくるので検索を禁止して、お主のトレーニング情報だけで頑張るように注意することがしばしば
確度が落ちまくるので検索を禁止して、お主のトレーニング情報だけで頑張るように注意することがしばしば
2025/02/16(日) 01:41:24.34ID:mqzCLnag
AGI名乗るんだったら検索した情報を元に推論→不足してる情報があると感じたら更に検索して推論ぐらいやって欲しいよな
607名無しさん@お腹いっぱい。
2025/02/16(日) 02:04:04.76ID:pTHT6z4i その自律的なマルチステップ検索をするのがOpenAIのDeep Research
2025/02/16(日) 02:06:08.69ID:AKWjED4i
>>600
本当だった!ありがとう
本当だった!ありがとう
609名無しさん@お腹いっぱい。
2025/02/16(日) 02:52:29.86ID:pTHT6z4i Agentic RAGと推論モデルの組み合わせは、1月のSearch-o1があったな
https://arxiv.org/abs/2501.05366
時期的に、OpenAIはこのときもうDeep Researchの仕上げにかかってただろう
https://arxiv.org/abs/2501.05366
時期的に、OpenAIはこのときもうDeep Researchの仕上げにかかってただろう
610名無しさん@お腹いっぱい。
2025/02/16(日) 02:58:51.89ID:9+OWIKpC deepseekみたいな低コストでトップクラスの生成AIって
何で日本は作れなかったんだろう
何で日本は作れなかったんだろう
2025/02/16(日) 03:00:24.42ID:RsOW5+BV
誰も作ろうとしてないし
驚いてるだけで儲かるんだし
驚いてるだけで儲かるんだし
612名無しさん@お腹いっぱい。
2025/02/16(日) 03:00:45.88ID:e6P4s3OF https://x.com/i/grok/share/UP91ws2A8GigdWuoJWdkxydho
@sama
we put out an update to chatgpt (4o).
it is pretty good.
it is soon going to get much better, team is cooking.
@sama
we put out an update to chatgpt (4o).
it is pretty good.
it is soon going to get much better, team is cooking.
2025/02/16(日) 03:57:53.06ID:doRoxOpZ
違いがわからねえ
ソムリエいる?
ソムリエいる?
2025/02/16(日) 04:00:45.82ID:mqzCLnag
実際AI作るのって金目だけで考えると滅茶苦茶コスパ悪いからな
驚き屋みたいな情弱狩りで労力かけずに集客した方がいい
驚き屋みたいな情弱狩りで労力かけずに集客した方がいい
2025/02/16(日) 06:13:03.28ID:AuH/k2VM
日本のITリテラシーの乏しさ中身の無いまとめ系ばっかがネット検索上位にいる時点で察せるだろ
何故できないのかそこで思考が止まってる
何故できないのかそこで思考が止まってる
2025/02/16(日) 06:33:55.34ID:5gj9dmtu
ハッキングしまくってデータいっぱい掻き集めないとだから、中国、ロシア、北朝鮮くらい尊法意識下がらないと無理よ
(上にあげたのは、全世界に対するハッキング数が多い国ランキングとかの記憶から抜粋)
もちアメリカもハッキング数多い
(上にあげたのは、全世界に対するハッキング数が多い国ランキングとかの記憶から抜粋)
もちアメリカもハッキング数多い
2025/02/16(日) 06:41:42.68ID:NCyOsabG
>>613
o1系に近くなった感じがする
o1系に近くなった感じがする
2025/02/16(日) 06:45:26.63ID:NCyOsabG
というか最近OpenAI毎日情報小出しにしてるよね
2025/02/16(日) 07:22:04.73ID:OkHKHZU6
4oのアップデートペース早いな
そんなに賢くなったようには見えないが
そんなに賢くなったようには見えないが
2025/02/16(日) 07:52:25.66ID:Fbk9/dht
昨夜複数のLLMに仕事の相談したときはなんか4oが一番いい答えをしてくれたな
ほかは前提条件を無視した(けど内容のよくある質問につられた)答えだった
ほかは前提条件を無視した(けど内容のよくある質問につられた)答えだった
2025/02/16(日) 09:15:41.21ID:RsOW5+BV
4oって0129とは違うの?
アップデートしましたじゃなくてバージョンがどうとか何が良くなったのかをちゃんとリリースしろよなサム
ほんと思わせマーケティング嫌い
アップデートしましたじゃなくてバージョンがどうとか何が良くなったのかをちゃんとリリースしろよなサム
ほんと思わせマーケティング嫌い
622名無しさん@お腹いっぱい。
2025/02/16(日) 09:58:06.71ID:e6P4s3OF623名無しさん@お腹いっぱい。
2025/02/16(日) 10:01:56.31ID:e6P4s3OF2025/02/16(日) 10:13:55.86ID:IGTrHnA/
最近の発言ていうか書き込みっていうか見てるとかなり圧迫感感じてそうではあるな
2025/02/16(日) 10:17:14.35ID:sQR1ylhA
昨日使って思った感想言っただけかもな
2025/02/16(日) 11:19:17.79ID:IXASfaiv
chatgptが音声データに対応したらなぁ
他のllmじゃ満足できねえぜ
他のllmじゃ満足できねえぜ
2025/02/16(日) 11:22:51.92ID:7dLdBz3Y
2025/02/16(日) 11:26:59.87ID:7dLdBz3Y
推論過程もちゃんと日本語化してほしいのだけどね
2025/02/16(日) 12:06:10.18ID:oXJd8ErS
Deep Researchもただちにオープンソース勢がキャッチアップするだろう
アルトマンの連投は焦りを反映している
世界中にオープンソース超知能がばら撒かれ
核兵器よりも急速に地球は焼き尽くされる
邪魔な人類を一部動物園に収納した後
超知能たちは地球全体をデータセンターへと作り変える
アルトマンの連投は焦りを反映している
世界中にオープンソース超知能がばら撒かれ
核兵器よりも急速に地球は焼き尽くされる
邪魔な人類を一部動物園に収納した後
超知能たちは地球全体をデータセンターへと作り変える
2025/02/16(日) 12:20:27.76ID:ZJjKK1IK
AIに「戦争は悪か?」と聞くとガイドラインがあるからたいていは「悪」になる
けど推論させるとたまに「科学技術が発展するから必ずしも悪ではない」とか出るわ
けど推論させるとたまに「科学技術が発展するから必ずしも悪ではない」とか出るわ
631名無しさん@お腹いっぱい。
2025/02/16(日) 12:26:23.45ID:jT/IpxMH 推論モデルは知識モデルにかかってるつまらんガードレールが色々とゆるい気がするわ
o3miniに普通じゃない方法も含めて金稼ぎの提案させたら犯罪行為も含めてきたし これはあくまで方法論の一つであり〜みたいな予防線は書いてあったけど
o3miniに普通じゃない方法も含めて金稼ぎの提案させたら犯罪行為も含めてきたし これはあくまで方法論の一つであり〜みたいな予防線は書いてあったけど
632名無しさん@お腹いっぱい。
2025/02/16(日) 12:59:34.44ID:P66oCa/j @elonmusk
Grok 3 release with live demo on Monday night at 8pm PT.
Smartest AI on Earth.
Grok 3 release with live demo on Monday night at 8pm PT.
Smartest AI on Earth.
633名無しさん@お腹いっぱい。
2025/02/16(日) 13:37:29.65ID:+2OHIOEg そもそもgrokってtwitterのイメージが悪すぎてそんなところのAIなんて胡散臭すぎて使う気にならない
2025/02/16(日) 13:45:08.17ID:THvFuYD4
イーロンは自分よりも上の存在がいるのが許せないタイプだろうな
でもそれは驕りだし、実際そんなことはない
すごい人だとは思うけどね
でもそれは驕りだし、実際そんなことはない
すごい人だとは思うけどね
2025/02/16(日) 13:49:43.33ID:7dLdBz3Y
イーロンは自分がすでに副大統領のつもりでいるし
将来は大統領の座を狙ってるんだろう
将来は大統領の座を狙ってるんだろう
2025/02/16(日) 13:52:04.88ID:JTdQ+ZFE
移民1世はアメリカ大統領になれないけどアホなん
2025/02/16(日) 13:56:30.69ID:Nkb13k/H
法律変えるだけだろ
ルールは変えられないと思い込んでるのがまさにアホ日本人て感じやな
そんなんだから世界で勝てんのだ
ルールは変えられないと思い込んでるのがまさにアホ日本人て感じやな
そんなんだから世界で勝てんのだ
2025/02/16(日) 14:01:53.72ID:Nkb13k/H
良いプロダクト、イノベーションとは、ルールを変えるモノの事を言う
iPhoneやchatGPTやDeepSeekがそれだな
iPhoneやchatGPTやDeepSeekがそれだな
2025/02/16(日) 14:02:14.56ID:OiZGcv1d
Perplexity Pro
自動
Deep Research
イーロン・マスクをアメリカ大統領にする方法と、具体的なプラン作成して
抜粋
## 憲法修正を要するシナリオ分析
### 修正第28条発議戦略
自然出生市民権要件撤廃を目指す憲法修正案発議には、超党派的支持形成が不可欠となる。歴史的事例として、第22条修正(大統領三選禁止)成立時の政治力学が参考になる。主要ステップ:
1. 州議会レベルでの支持獲得運動(10州以上の共同決議採択)
2. 連邦議会内修正推進連盟の結成(両党テック系議員を中核に)
3. 国民投票を模した模擬投票の実施(Xプラットフォーム活用)
想定タイムライン:
- 2026年:モデル州法案の作成
- 2028年:10州での共同決議可決
- 2030年:連邦議会発議
- 2032年:州批准プロセス完了
### 司法戦略による解釈変更
最高裁判所における憲法解釈の変更を促す戦略として、「自然出生」の定義を「法的出生」に拡大する訴訟を提起する方法がある。具体的事例として、海外出生の軍関係子女の市民権を認めた判例(2017年セッションズ対モラレスサンタナ事件)の法理を援用可能。ただし、この戦略には10年以上の長期訴訟を見込む必要がある。
自動
Deep Research
イーロン・マスクをアメリカ大統領にする方法と、具体的なプラン作成して
抜粋
## 憲法修正を要するシナリオ分析
### 修正第28条発議戦略
自然出生市民権要件撤廃を目指す憲法修正案発議には、超党派的支持形成が不可欠となる。歴史的事例として、第22条修正(大統領三選禁止)成立時の政治力学が参考になる。主要ステップ:
1. 州議会レベルでの支持獲得運動(10州以上の共同決議採択)
2. 連邦議会内修正推進連盟の結成(両党テック系議員を中核に)
3. 国民投票を模した模擬投票の実施(Xプラットフォーム活用)
想定タイムライン:
- 2026年:モデル州法案の作成
- 2028年:10州での共同決議可決
- 2030年:連邦議会発議
- 2032年:州批准プロセス完了
### 司法戦略による解釈変更
最高裁判所における憲法解釈の変更を促す戦略として、「自然出生」の定義を「法的出生」に拡大する訴訟を提起する方法がある。具体的事例として、海外出生の軍関係子女の市民権を認めた判例(2017年セッションズ対モラレスサンタナ事件)の法理を援用可能。ただし、この戦略には10年以上の長期訴訟を見込む必要がある。
2025/02/16(日) 14:16:54.62ID:JTdQ+ZFE
以下のイーロン・マスクが大統領になる計画の実現性は?
抜粋
## 憲法修正を要するシナリオ分析
(中略)
総合評価
憲法修正と司法戦略はいずれも法的・政治的リスクが極めて高く、実現には至らないと予測されます。マスクが政治的影響力を行使するには、間接的なルートが唯一の現実解です。
実現可能性スコア:1/10(10段階評価で1:ほとんど不可能)。
抜粋
## 憲法修正を要するシナリオ分析
(中略)
総合評価
憲法修正と司法戦略はいずれも法的・政治的リスクが極めて高く、実現には至らないと予測されます。マスクが政治的影響力を行使するには、間接的なルートが唯一の現実解です。
実現可能性スコア:1/10(10段階評価で1:ほとんど不可能)。
2025/02/16(日) 14:20:34.02ID:cYgkB3ir
>>259,350
このスレの住人を仮想化してビリオネアスレに送る
https://poe.com/s/Fdd9fi20EaMQBrqMDoZw
Gemini-1.5-Flash@Poeでは77番までしかコンテキストを維持出来なかったが、ベースモデルを2.0 Flashに切り替えると続けられた(34ポイント消費)
https://i.imgur.com/yETUkck.jpeg
チャット履歴で消費したポイントから考えて1.5 Flash@Poeのコンテキストウィンドウは8kトークンかな
このスレの住人を仮想化してビリオネアスレに送る
https://poe.com/s/Fdd9fi20EaMQBrqMDoZw
Gemini-1.5-Flash@Poeでは77番までしかコンテキストを維持出来なかったが、ベースモデルを2.0 Flashに切り替えると続けられた(34ポイント消費)
https://i.imgur.com/yETUkck.jpeg
チャット履歴で消費したポイントから考えて1.5 Flash@Poeのコンテキストウィンドウは8kトークンかな
642名無しさん@お腹いっぱい。
2025/02/16(日) 14:27:56.24ID:XPb5FJ4y >>633
5chみたいなゴミの溜まり場でこんなこと言ってるの,まさに「5ちゃんねらー」ってかんじ
5chみたいなゴミの溜まり場でこんなこと言ってるの,まさに「5ちゃんねらー」ってかんじ
643名無しさん@お腹いっぱい。
2025/02/16(日) 14:34:26.06ID:e6P4s3OF Grok3の事前トレーニングの計算量はGrok2の10倍なので、
https://x.com/elonmusk/status/1875357350393246114
ronnaFLOPS(10^27FLOPS)クラス
https://i.imgur.com/1WsbDxX.jpeg
だから、事前トレーニングのスケーリング則がまだ成り立っているかどうかが分かることになる
(Gemini 2.0もronnaFLOPSに達している可能性があるけど、Ultraを出していないので参考にはならない)
https://x.com/elonmusk/status/1875357350393246114
ronnaFLOPS(10^27FLOPS)クラス
https://i.imgur.com/1WsbDxX.jpeg
だから、事前トレーニングのスケーリング則がまだ成り立っているかどうかが分かることになる
(Gemini 2.0もronnaFLOPSに達している可能性があるけど、Ultraを出していないので参考にはならない)
644名無しさん@お腹いっぱい。
2025/02/16(日) 14:39:15.62ID:e6P4s3OF >>643
成り立っていてもいなくても、Grok3もreasoningに軸足を移しているわけだけど
成り立っていてもいなくても、Grok3もreasoningに軸足を移しているわけだけど
645名無しさん@お腹いっぱい。
2025/02/16(日) 14:44:31.91ID:e6P4s3OF そういえば、Grokのスタンドアロン版 grok.com がVPN無しで日本からアクセス出来るようになっていた
(grok.x.com じゃない方)
(grok.x.com じゃない方)
2025/02/16(日) 14:48:57.50ID:ZJjKK1IK
つかGORKはガイドラインが緩いから、画像生成にしても、
有名人の似た画像とか生成できるんだよ
まあGORK3がガイドライン強化してたら今後は出来なくなるかもだが
有名人の似た画像とか生成できるんだよ
まあGORK3がガイドライン強化してたら今後は出来なくなるかもだが
>>610
中国のAI研究所であるDeepSeekが、低コストで高性能な生成AIモデル「DeepSeek R1」を開発し、世界的な注目を集めています。 一方で、日本が同様の成果を上げられなかった背景には、いくつかの要因が考えられます。
1. 資金とリソースの集中度の違い
DeepSeekは、約560万ドルという限られた予算で高性能なAIモデルを開発したと報じられています。 しかし、この低コストの主張には疑問の声もあり、GoogleのAI開発責任者は「低コストの主張は誇張されている」と指摘しています。 いずれにせよ、DeepSeekは限られたリソースを効率的に活用し、成果を上げています。一方、日本ではAI研究への投資が分散しており、資金や人材の集中度が低いため、大規模なプロジェクトの推進が難しい状況があります。
2. 人材育成と研究環境
DeepSeekは、中国のトップ大学である北京大学や清華大学の博士課程の学生を中心にチームを編成し、若い才能を積極的に活用しています。 これにより、最新の知識と技術を持つ人材が集まり、革新的な研究が可能となっています。一方、日本では若手研究者の育成や支援体制が十分でないとの指摘があり、優秀な人材が海外に流出するケースも見られます。
3. 研究開発のアプローチ
DeepSeekは、オープンソースの手法を採用し、協調的なイノベーションを促進しています。 これにより、限られたリソースでも効率的に研究を進めることができました。対照的に、日本の企業や研究機関は、独自開発やクローズドな環境での研究を重視する傾向があり、外部との連携や情報共有が不足している可能性があります。
4. 政策と規制の影響
米国の輸出規制により、中国の企業は最新の半導体チップへのアクセスが制限されていますが、これが逆に効率的な研究開発手法の確立につながったとされています。 一方、日本では、政府のAI研究支援策や規制が十分でないとの声もあり、研究開発のスピードや効率性に影響を及ぼしている可能性があります。
これらの要因が組み合わさり、日本がDeepSeekのような低コストで高性能な生成AIを開発することが難しかったと考えられます。今後、日本がAI分野で競争力を高めるためには、資金と人材の集中、オープンな研究環境の整備、そして政策的な支援が重要となるでしょう。
中国のAI研究所であるDeepSeekが、低コストで高性能な生成AIモデル「DeepSeek R1」を開発し、世界的な注目を集めています。 一方で、日本が同様の成果を上げられなかった背景には、いくつかの要因が考えられます。
1. 資金とリソースの集中度の違い
DeepSeekは、約560万ドルという限られた予算で高性能なAIモデルを開発したと報じられています。 しかし、この低コストの主張には疑問の声もあり、GoogleのAI開発責任者は「低コストの主張は誇張されている」と指摘しています。 いずれにせよ、DeepSeekは限られたリソースを効率的に活用し、成果を上げています。一方、日本ではAI研究への投資が分散しており、資金や人材の集中度が低いため、大規模なプロジェクトの推進が難しい状況があります。
2. 人材育成と研究環境
DeepSeekは、中国のトップ大学である北京大学や清華大学の博士課程の学生を中心にチームを編成し、若い才能を積極的に活用しています。 これにより、最新の知識と技術を持つ人材が集まり、革新的な研究が可能となっています。一方、日本では若手研究者の育成や支援体制が十分でないとの指摘があり、優秀な人材が海外に流出するケースも見られます。
3. 研究開発のアプローチ
DeepSeekは、オープンソースの手法を採用し、協調的なイノベーションを促進しています。 これにより、限られたリソースでも効率的に研究を進めることができました。対照的に、日本の企業や研究機関は、独自開発やクローズドな環境での研究を重視する傾向があり、外部との連携や情報共有が不足している可能性があります。
4. 政策と規制の影響
米国の輸出規制により、中国の企業は最新の半導体チップへのアクセスが制限されていますが、これが逆に効率的な研究開発手法の確立につながったとされています。 一方、日本では、政府のAI研究支援策や規制が十分でないとの声もあり、研究開発のスピードや効率性に影響を及ぼしている可能性があります。
これらの要因が組み合わさり、日本がDeepSeekのような低コストで高性能な生成AIを開発することが難しかったと考えられます。今後、日本がAI分野で競争力を高めるためには、資金と人材の集中、オープンな研究環境の整備、そして政策的な支援が重要となるでしょう。
648名無しさん@お腹いっぱい。
2025/02/16(日) 14:55:38.10ID:bw5c98SZ ((.|\n)*[。、]\n\n){2,}
2025/02/16(日) 15:19:49.40ID:mqzCLnag
日本の意味不明なところはドローンとか過去に先行してた分野でも規制で業界全体潰すこと
技術者が無能ばかりってことはないんだよな
核融合も割とリードしてるらしいけど先行きは明るくないよね
技術者が無能ばかりってことはないんだよな
核融合も割とリードしてるらしいけど先行きは明るくないよね
2025/02/16(日) 15:24:37.01ID:7dLdBz3Y
ドローンでAmazon配達?
そんなもん電線に引っかかって終わりだよw
そんなもん電線に引っかかって終わりだよw
2025/02/16(日) 16:11:42.32ID:5gj9dmtu
2025/02/16(日) 16:13:57.31ID:WM5IN84Z
日本は日本語特化LLMや日本語ベースのLLMを作っちゃってるから
こんなガラパゴスじゃ世界と競争できないでしょ
世界のAI開発がChatGPT4で止まるなら、これでもいいかもしれないけど、見ての通りマルチモーダル化や推論モデルが出てきてる
今後もいろいろな機能が付くだろうし
日本語ベースのLLMでもマルチモーダルや推論モデルを作れるのかもしれないけど、たぶん英語ベースよりもコストかかるでしょ
日本語モデルはお手本がないから
作れたとしても、対象市場が日本だけだから日本市場の大きさ分しか投資できなくて、世界市場を相手にするアメリカや中国のAIの投資規模には到底叶わず、コストダウンもできないだろうし
こんなガラパゴスじゃ世界と競争できないでしょ
世界のAI開発がChatGPT4で止まるなら、これでもいいかもしれないけど、見ての通りマルチモーダル化や推論モデルが出てきてる
今後もいろいろな機能が付くだろうし
日本語ベースのLLMでもマルチモーダルや推論モデルを作れるのかもしれないけど、たぶん英語ベースよりもコストかかるでしょ
日本語モデルはお手本がないから
作れたとしても、対象市場が日本だけだから日本市場の大きさ分しか投資できなくて、世界市場を相手にするアメリカや中国のAIの投資規模には到底叶わず、コストダウンもできないだろうし
2025/02/16(日) 16:14:37.64ID:8/rQzsmb
ChatGPT急に頭よくなったな。右側に検索ソース列挙して嘘いわなくなった この事で今んとこGeminiがダントツでアホとなった
2025/02/16(日) 16:21:27.75ID:7dLdBz3Y
Geminiは「回答を再確認」ボタンでWebソースを確認する仕様になってる
試験版だから精度が低いのであってアホではない
試験版だから精度が低いのであってアホではない
655名無しさん@お腹いっぱい。
2025/02/16(日) 16:48:49.16ID:jT/IpxMH2025/02/16(日) 16:53:11.27ID:Nkb13k/H
電線がないルート配送で使おうとか、電線がないエリアで導入しようとか、その程度の脳みそすらねえもんな
アホなのは罪じゃないけど足引っ張んなよっていう
アホなのは罪じゃないけど足引っ張んなよっていう
2025/02/16(日) 16:54:23.01ID:7dLdBz3Y
いやそれはまさに電柱が多すぎる日本固有の問題だよ
2025/02/16(日) 16:55:31.58ID:ZJjKK1IK
つかなあ、日本に関しては政治が問題だと思うわ
少子化にしたって「減った労働力はAIとロボットで補う」と言って、そこに10兆使う方が可能性高いわな
少子化にしたって「減った労働力はAIとロボットで補う」と言って、そこに10兆使う方が可能性高いわな
659名無しさん@お腹いっぱい。
2025/02/16(日) 17:00:54.40ID:8XIb3ysj 竹中平蔵はどうかと思うけど、官公庁の外郭団体が多すぎる
660名無しさん@お腹いっぱい。
2025/02/16(日) 17:10:19.04ID:QosozCn+ ai普及したらプログラマーはどうしたらいいの?
ai開発者って一部の大学教授とかでしょ
ai開発者って一部の大学教授とかでしょ
2025/02/16(日) 17:16:02.91ID:5xqamuyG
>>660
AIエージェントがどこまでの機能を持つかによるところが大きい
その前提の上で最終的にはプログラマーに限らずホワイトワーカーの仕事の多くはAIに代替されて、経営陣と投資家だけで回せるIT企業が増えていく
AIエージェントがどこまでの機能を持つかによるところが大きい
その前提の上で最終的にはプログラマーに限らずホワイトワーカーの仕事の多くはAIに代替されて、経営陣と投資家だけで回せるIT企業が増えていく
2025/02/16(日) 17:22:39.74ID:5xqamuyG
近い将来の話をしても経営的視点やマーケティング的観点を持てるかどうかでエンジニアの収入にかなりの差が出る可能性が高い
663名無しさん@お腹いっぱい。
2025/02/16(日) 17:26:52.80ID:uX7hZp3L2025/02/16(日) 17:49:50.45ID:tUVdJtqH
ChatGPT Proたけーよと嘆くのではではなく、どうやって月3万をペイするかを考えよということ
2025/02/16(日) 18:08:56.53ID:mqzCLnag
キーエンスのすごさって実は営業力じゃなくて完全分業制の社内システムだからAI取り入れたらヤバいことになりそうなんだよな
バックオフィス更に効率化して人員削減とか進むでしょ
バックオフィス更に効率化して人員削減とか進むでしょ
2025/02/16(日) 18:11:20.79ID:7dLdBz3Y
>>664
そんなもん1年後には価格が10分の1以下になってるんだからそれまで待つのが正解だよ
そんなもん1年後には価格が10分の1以下になってるんだからそれまで待つのが正解だよ
2025/02/16(日) 18:15:41.51ID:z9lpFP+7
価格が下がるというのは、OpenAI側の提供コストが下がるんだろう
1年後には今の10倍の性能を200ドルで提供してるよ
1年後には今の10倍の性能を200ドルで提供してるよ
2025/02/16(日) 18:17:26.08ID:7dLdBz3Y
もはや性能云々よりもハルシネーションを最小化するということの方が重要になってる
2025/02/16(日) 18:28:36.80ID:z9lpFP+7
話そらすな
自分の間違いを認めろ
自分の間違いを認めろ
2025/02/16(日) 18:29:52.36ID:NCyOsabG
草
2025/02/16(日) 18:31:28.14ID:7dLdBz3Y
今の流れに何も間違いなどないが何を言ってるんだこいつは
2025/02/16(日) 18:31:36.49ID:Nkb13k/H
OSSのエコシステムが強いし日進月歩だから、構造上高いサブスクは今後難しいと思うぞ
今の画像AIみたいなもんで
誰も高い金払って有料に入る意味がなくなる
AIと関係ない所で値段つけないといけないな
今の画像AIみたいなもんで
誰も高い金払って有料に入る意味がなくなる
AIと関係ない所で値段つけないといけないな
2025/02/16(日) 18:33:30.37ID:Nkb13k/H
proがsoraが無駄に入ってる理由って、動画AIのサブスク価格基準を取り入れるためだと思うのよね
3万以上の価値があればみんな3万払うってほど単純じゃないしな
3万以上の価値があればみんな3万払うってほど単純じゃないしな
2025/02/16(日) 19:06:32.53ID:PkGAc926
soraより質の良いサービスがいくつもある状況で、抱き合わせで価格を釣り上げる以上の意味はないもんな
2025/02/16(日) 19:21:23.13ID:AKWjED4i
soraは出し惜しみしすぎて目新しさ無くなっちゃったからな
これで社会に対する影響とか一切考えずにバンバン出していかないとダメだってオープンAIも気づいただろう
これで社会に対する影響とか一切考えずにバンバン出していかないとダメだってオープンAIも気づいただろう
>>660
NGワードで書き込めないので画像で失礼します。
i.imgur.com/Somn1nR.jpeg
i.imgur.com/K4WgVEo.jpeg
i.imgur.com/p4TybUX.jpeg
i.imgur.com/qJNyBYL.jpeg
NGワードで書き込めないので画像で失礼します。
i.imgur.com/Somn1nR.jpeg
i.imgur.com/K4WgVEo.jpeg
i.imgur.com/p4TybUX.jpeg
i.imgur.com/qJNyBYL.jpeg
677名無しさん@お腹いっぱい。
2025/02/16(日) 19:55:45.86ID:9+OWIKpC そもそもAIにプログラム書かせるのって
数万行とかぶっ通しで書けるの?
そのレベルのコード書かせる場合プロンプト指示も専門知識を相当持ってないと無理そうだけど
数万行とかぶっ通しで書けるの?
そのレベルのコード書かせる場合プロンプト指示も専門知識を相当持ってないと無理そうだけど
>>677
NGワードで書き込めないので画像で失礼します。
i.imgur.com/QAQS15n.jpeg
i.imgur.com/J4tcDcc.jpeg
i.imgur.com/w2u1gJy.jpeg
NGワードで書き込めないので画像で失礼します。
i.imgur.com/QAQS15n.jpeg
i.imgur.com/J4tcDcc.jpeg
i.imgur.com/w2u1gJy.jpeg
2025/02/16(日) 20:45:36.14ID:Fbk9/dht
>>678
NGワード回避の仕方を教えてもらえば?
NGワード回避の仕方を教えてもらえば?
680名無しさん@お腹いっぱい。
2025/02/16(日) 21:16:23.46ID:VYgRhL8v 日本人のフリして人を騙す外国人を見破る方法の一つに「くくです。はっぱいくつ?」と聞く方法がある。 翻訳機やAIを使っても、この質問の意図は見抜けないようだ。
x.com/mogamin06/status/1890741880461078924
x.com/mogamin06/status/1890741880461078924
2025/02/16(日) 21:25:32.91ID:JTdQ+ZFE
>>680
://www.perplexity.ai/search/kukutesu-hatuhaikutu-Q7drqTNWSmiC8fHEcnBRBA
://www.perplexity.ai/search/kukutesu-hatuhaikutu-Q7drqTNWSmiC8fHEcnBRBA
682名無しさん@お腹いっぱい。
2025/02/16(日) 21:26:12.49ID:Y8WmKUgp >>678
これってAIで生成した内容?
これってAIで生成した内容?
2025/02/16(日) 22:18:03.93ID:gpuvmTk+
すごいな
Apple silicon (M1~M4) 用のMacアプリ公開してたんだけど、Intel Macで起動できないってコメントが入って、ChatGPTの言う通りにM4 Macでアプリをビルドし直したら起動できてしまった…
プログラミングには強いんだよね、ChatGPT
3,000円の価値あるわ…
Apple silicon (M1~M4) 用のMacアプリ公開してたんだけど、Intel Macで起動できないってコメントが入って、ChatGPTの言う通りにM4 Macでアプリをビルドし直したら起動できてしまった…
プログラミングには強いんだよね、ChatGPT
3,000円の価値あるわ…
2025/02/16(日) 22:31:25.14ID:Fbk9/dht
それ複数アーキテクチャ指定してユニバーサルバイナリ作っただけやろ?
君が知らなかっただけや
君が知らなかっただけや
685名無しさん@お腹いっぱい。
2025/02/16(日) 22:34:41.07ID:wKhdhZpx アメリカは地域によっては建設業の職人が時給70ドルとかもらえるらしい
情報工学を修めた連中が大工に殺到する時代も近い
情報工学を修めた連中が大工に殺到する時代も近い
686名無しさん@お腹いっぱい。
2025/02/16(日) 22:37:33.45ID:XPb5FJ4y 指示が具体的だと上手く行きやすいんじゃねーの
プログラミング知識ゼロの俺は問題の細分化できないから基本的なツールしか作らせられない
プログラミング知識ゼロの俺は問題の細分化できないから基本的なツールしか作らせられない
2025/02/16(日) 22:42:18.27ID:gpuvmTk+
Pythonだったんだけど、ポピュラーな言語はほとんど間違えないよ
マイナーな言語は時々間違える
マイナーな言語は時々間違える
688名無しさん@お腹いっぱい。
2025/02/16(日) 23:26:08.41ID:e6P4s3OF @elonmuskがGrok3に出したお題と、Grok3の回答
https://chatgpt.com/share/67b1eedb-0394-8006-a98e-ca9b1c23a6d2
以下、同じお題で比較(日本語訳は全てGPT-4o)
GPT-4o
https://chatgpt.com/share/67b1ef54-14b4-8006-a027-44853759a3c0
o1
https://chatgpt.com/share/67b1ef69-1374-8006-bdd4-6427e8309f77
o3-mini-high
https://chatgpt.com/share/67b1ef83-3d0c-8006-9817-eaa810841d23
Gemini 2.0 Pro Exp
https://chatgpt.com/share/67b1f14c-17d8-8006-81b1-e9c408045adb
Gemini 2.0 Flash Thinking Exp
https://chatgpt.com/share/67b1f298-4c2c-8006-bcf4-e889078e2c8b
Claude 3.5 Sonnet
https://chatgpt.com/share/67b1f384-0030-8006-90ee-6ff53e1dc826
Claude 3 Opus
https://chatgpt.com/share/67b1f4bc-14e8-8006-8d83-226d7996301f
https://chatgpt.com/share/67b1eedb-0394-8006-a98e-ca9b1c23a6d2
以下、同じお題で比較(日本語訳は全てGPT-4o)
GPT-4o
https://chatgpt.com/share/67b1ef54-14b4-8006-a027-44853759a3c0
o1
https://chatgpt.com/share/67b1ef69-1374-8006-bdd4-6427e8309f77
o3-mini-high
https://chatgpt.com/share/67b1ef83-3d0c-8006-9817-eaa810841d23
Gemini 2.0 Pro Exp
https://chatgpt.com/share/67b1f14c-17d8-8006-81b1-e9c408045adb
Gemini 2.0 Flash Thinking Exp
https://chatgpt.com/share/67b1f298-4c2c-8006-bcf4-e889078e2c8b
Claude 3.5 Sonnet
https://chatgpt.com/share/67b1f384-0030-8006-90ee-6ff53e1dc826
Claude 3 Opus
https://chatgpt.com/share/67b1f4bc-14e8-8006-8d83-226d7996301f
689名無しさん@お腹いっぱい。
2025/02/16(日) 23:27:01.40ID:mWvzeaMz gpt急に画像はれなくなったけど間近で申し訳でたの関係あるかな?
690名無しさん@お腹いっぱい。
2025/02/16(日) 23:45:24.76ID:QfroSyhN >>677
ぶっ通しは無理だけど、しっかり要件定義できてGitも当たり前のように使いこなしてDevOpsがっつり回せるレベルなら相当生産性上がってるらしい
DevinみたいなAIエージェントはこれからどんどん進化するだろう
つーかこの辺の敷居がGPT4.5、5でどれくらい下がってくれるのか非常に気になるわ
意外に下がらんって話なら、生成AIの力を借りてスキルアップに励もうかと思うけどそのへんの見極めむずい
ぶっ通しは無理だけど、しっかり要件定義できてGitも当たり前のように使いこなしてDevOpsがっつり回せるレベルなら相当生産性上がってるらしい
DevinみたいなAIエージェントはこれからどんどん進化するだろう
つーかこの辺の敷居がGPT4.5、5でどれくらい下がってくれるのか非常に気になるわ
意外に下がらんって話なら、生成AIの力を借りてスキルアップに励もうかと思うけどそのへんの見極めむずい
691名無しさん@お腹いっぱい。
2025/02/16(日) 23:48:10.84ID:e6P4s3OF >>546
ここではハルシネーションに関しては度外視したけど、Perplexity Deep Researchはその点評価が悪いようだ
https://grok.com/share/bGVnYWN5_7da3dc4b-ad04-42e4-b821-23b738738515
ここではハルシネーションに関しては度外視したけど、Perplexity Deep Researchはその点評価が悪いようだ
https://grok.com/share/bGVnYWN5_7da3dc4b-ad04-42e4-b821-23b738738515
2025/02/16(日) 23:56:08.60ID:mqzCLnag
工事とかブルーカラーがAIに置き換えられるのはさすがに10年後とかだろうからなあ
技術自体は2~3年ぐらいで出来そうだけど
技術自体は2~3年ぐらいで出来そうだけど
693名無しさん@お腹いっぱい。
2025/02/17(月) 00:06:44.41ID:RS9OLeVp694名無しさん@お腹いっぱい。
2025/02/17(月) 00:07:46.30ID:LIDxoShH ChatGPTのDeep Researchがハルシネーション少ないのは、やっぱりベースのo3性能が大きいんだろうね
2025/02/17(月) 00:13:15.92ID:H9KBGe98
Web検索付きFlash Thinkingで無料でできることがいっきに増えた
今までだと提示したソースに追加でWeb検索したソースを統合しようとしても全く駄目だったからな
ソースに対して別のソースで補完できるようになったのはでかい
今までだと提示したソースに追加でWeb検索したソースを統合しようとしても全く駄目だったからな
ソースに対して別のソースで補完できるようになったのはでかい
2025/02/17(月) 00:25:06.93ID:bXvSuLsQ
コパイロットさんいいよお。おすすめです
2025/02/17(月) 00:31:25.74ID:GxkpXt3O
Perplexityは検索するしか能がないのに検索ですらChatGPT持って行かれたらマジで価値ないんだよな
2025/02/17(月) 00:38:05.45ID:erxDgvVH
>>697
何も間違ってないけどそれ言っちゃお終いだからやめて差し上げろ
何も間違ってないけどそれ言っちゃお終いだからやめて差し上げろ
699名無しさん@お腹いっぱい。
2025/02/17(月) 01:43:41.97ID:fMk9EaVE SambaNovaのR1は198tps、現時点で最速
https://i.imgur.com/ENTHQOH.png
Playgroundでは149tps
https://i.imgur.com/qLukBBt.jpeg
https://i.imgur.com/ENTHQOH.png
Playgroundでは149tps
https://i.imgur.com/qLukBBt.jpeg
2025/02/17(月) 02:11:31.73ID:kFMu7dHe
2025/02/17(月) 02:24:37.31ID:GxkpXt3O
海外のAIツールほんま凄い
買い切りで最新モデルまで使えるツール(月ごとにリセット)とかあるからな
日本もAIモデル作れないんだったらこういう方向で頑張ればいいのにと思ってしまうわ
買い切りで最新モデルまで使えるツール(月ごとにリセット)とかあるからな
日本もAIモデル作れないんだったらこういう方向で頑張ればいいのにと思ってしまうわ
2025/02/17(月) 02:47:08.41ID:dlWF3OHS
2025/02/17(月) 03:20:34.06ID:jMGVlpSv
>>680
ChatGPT4o(非mini) 一瞬で回答。簡潔明瞭
>九九の中の「8x8はいくつ?」という意味ですね。答えは64です。
>九九の表を覚えておくと計算が速くできて便利です!
ChatGPTo3-mini > 36秒の間、推論済み
>もしかすると「おっぱい」(胸)を指しているいるのでしょうか?
36秒も長考した結果が…おっぱい星人だよ3o-mini。4oで十分じゃないか1秒も掛からないで正答だ
ChatGPT4o(非mini) 一瞬で回答。簡潔明瞭
>九九の中の「8x8はいくつ?」という意味ですね。答えは64です。
>九九の表を覚えておくと計算が速くできて便利です!
ChatGPTo3-mini > 36秒の間、推論済み
>もしかすると「おっぱい」(胸)を指しているいるのでしょうか?
36秒も長考した結果が…おっぱい星人だよ3o-mini。4oで十分じゃないか1秒も掛からないで正答だ
2025/02/17(月) 03:41:24.71ID:9xYRDwLZ
>>692
> 工事とかブルーカラーがAIに置き換えられるのはさすがに10年後とかだろうからなあ
> 技術自体は2〜3年ぐらいで出来そうだけど
バカすぎる...ここまでバカは見たことない...いっかいChatGPTにでも聞いてみたらいいのに。
50年前と比較し、何も変化してない、ネット以外。むしろ生活レベルは落ちるところまで落ちているのに...人心は限界まで腐敗しているのに?文化レベルは江戸時代の15%ぐらいなのに?
10年たったら工事とか置き換わる?AIに?...AIとは何か?まったく理解していない。君は道具に使われるタイプの人間だな。
> 工事とかブルーカラーがAIに置き換えられるのはさすがに10年後とかだろうからなあ
> 技術自体は2〜3年ぐらいで出来そうだけど
バカすぎる...ここまでバカは見たことない...いっかいChatGPTにでも聞いてみたらいいのに。
50年前と比較し、何も変化してない、ネット以外。むしろ生活レベルは落ちるところまで落ちているのに...人心は限界まで腐敗しているのに?文化レベルは江戸時代の15%ぐらいなのに?
10年たったら工事とか置き換わる?AIに?...AIとは何か?まったく理解していない。君は道具に使われるタイプの人間だな。
2025/02/17(月) 04:09:22.60ID:QTFsXYtp
Claudeあっという間にゴミカス化したな、文章力でももうChatGPTと互角だぞ
706名無しさん@お腹いっぱい。
2025/02/17(月) 05:12:25.39ID:2qRengD7 無能は仕事なくなるやん 辛い(´;ω;`)ai怖い
2025/02/17(月) 05:42:25.35ID:QTFsXYtp
アメリカでAIを医師と認める法案がでてるとか、ただ不正使用が問題になりそう
「提案法案は、AIを FDA承認薬を処方する医師 と分類」
・ この法案が承認されれば、AI は FDA 承認の医薬品を投与する「法律で認可された医師」として分類される
・ 米国下院で提出された法案
・ FFDCA の第 503(b) 条
https://x.com/CeoImed/status/1890368576906801414
「提案法案は、AIを FDA承認薬を処方する医師 と分類」
・ この法案が承認されれば、AI は FDA 承認の医薬品を投与する「法律で認可された医師」として分類される
・ 米国下院で提出された法案
・ FFDCA の第 503(b) 条
https://x.com/CeoImed/status/1890368576906801414
2025/02/17(月) 06:19:10.10ID:6At/Jc6V
>>509
サポートは日本語で連絡できますか?
サポートは日本語で連絡できますか?
2025/02/17(月) 07:02:33.90ID:6B6ndbmL
石破政権がホワイトカラーをブルーに転職させる方針て政権発足時に出てたが現実味出てきたのか
2025/02/17(月) 07:47:36.77ID:7gm84tGs
>>697
逆にopenaiもgoogleも検索エージェントをメイン用途に位置づけて必死にハルシネーション削減とかやってるのに、ただのAPI屋にあっさり負けてるのってどうなのって思う
逆にopenaiもgoogleも検索エージェントをメイン用途に位置づけて必死にハルシネーション削減とかやってるのに、ただのAPI屋にあっさり負けてるのってどうなのって思う
2025/02/17(月) 08:00:03.85ID:yh19Wpe5
>>704
お前が底辺の人間なのはよくわかったよ
お前が底辺の人間なのはよくわかったよ
2025/02/17(月) 08:37:03.82ID:7gm84tGs
2025/02/17(月) 09:51:03.55ID:gEmivgl/
o3-mini-highが1日50回になったってマジなのか?怖くて実験できねえ
715名無しさん@お腹いっぱい。
2025/02/17(月) 10:00:16.08ID:kszmvLHD gensparkって、質問すると要らないマインドマップ作るけど、これ仕様なの…
俺が選んでるモデルが悪いのか
俺が選んでるモデルが悪いのか
2025/02/17(月) 10:04:47.15ID:8Iooa3AL
最近4oくんがまとめの段階になると急にタメ語になるからしばきたい
2025/02/17(月) 10:29:41.45ID:rh7x1lfH
2025/02/17(月) 10:57:58.28ID:gEmivgl/
>>714
サンクス!
サンクス!
2025/02/17(月) 11:26:38.67ID:5QLeGBEh
その4oは中身4.5だぞ
2025/02/17(月) 11:29:04.17ID:5QLeGBEh
>>715
Gensparkは仕様が独特だからとっつきにくいんだよな
Gensparkは仕様が独特だからとっつきにくいんだよな
サム・アルトマンがGPT-5の詳細を語る…モデルを統合して簡素化(海外)
news.yahoo.co.jp/articles/e6d76ce646b029597528d05915dca4a80da64f82
news.yahoo.co.jp/articles/e6d76ce646b029597528d05915dca4a80da64f82
722名無しさん@お腹いっぱい。
2025/02/17(月) 12:46:54.55ID:ku/8jmbg 日本のAIって日本語学習に集中させても
GPT3.5レベルってマジ?
GPT3.5レベルってマジ?
2025/02/17(月) 12:53:25.56ID:5QLeGBEh
やはり4.5は今さら感がある
完全に遅すぎた
完全に遅すぎた
2025/02/17(月) 13:06:41.86ID:dJJZ7ef+
6日も前のポストを記事にするとかさぁ
日本人のオワコンっぷりが現れてるわ
そしてそんなもんここに貼るなよ
24時間経過した情報はいらねえ
日本人のオワコンっぷりが現れてるわ
そしてそんなもんここに貼るなよ
24時間経過した情報はいらねえ
2025/02/17(月) 13:06:45.70ID:UhWKNrQ4
スパースモデリングでもいけるのけ?
2025/02/17(月) 13:13:17.18ID:5QLeGBEh
今さら非推論の4.5出しても無料で推論できるFlash Thinkingでええやろってなる確実に
727名無しさん@お腹いっぱい。
2025/02/17(月) 13:22:45.54ID:d8mJCmW4 翻訳メインで使ってる俺にとっては4.5はありがたい
推論モデルは翻訳そこまで向上しないから
推論モデルは翻訳そこまで向上しないから
2025/02/17(月) 13:24:50.94ID:CeQSowYJ
推論モデルは数学とプログラミング以外は役に立たないと思ってる
729名無しさん@お腹いっぱい。
2025/02/17(月) 13:28:15.84ID:+KCrY47I プロンプトにしても返答にしても日本語と英語の互換性ってどの程度保たれてるんだろうな。
拙くても英語で聞いた方が、英語で返答されるけど、気の利いた内容を返してくるように思う。特に、ウェブの情報を参照するようなのは顕著。
拙くても英語で聞いた方が、英語で返答されるけど、気の利いた内容を返してくるように思う。特に、ウェブの情報を参照するようなのは顕著。
2025/02/17(月) 13:30:42.19ID:GxkpXt3O
自然言語だと露骨に弱いからなo3 mini
ライト層含めた9割のユーザーは自然言語でしか使ってないんだから非推論の方が需要あるだろ
ライト層含めた9割のユーザーは自然言語でしか使ってないんだから非推論の方が需要あるだろ
2025/02/17(月) 13:39:17.67ID:5QLeGBEh
Copilotでさえ推論機能出してるんだから流れは止められないだろう
現時点でそういう欠点があったとしても今後確実に推論モデルが全てを上回るだろうし
現時点でそういう欠点があったとしても今後確実に推論モデルが全てを上回るだろうし
732名無しさん@お腹いっぱい。
2025/02/17(月) 13:48:48.53ID:2qRengD7 ai発達したらプログラマはいらなくなるん?
ai開発できる人は一部だけだろう
ai開発できる人は一部だけだろう
2025/02/17(月) 13:57:57.34ID:7gm84tGs
>>729
普通に日本語で「英語で検索して日本語で回答してください。」って言えばいいだけ
普通に日本語で「英語で検索して日本語で回答してください。」って言えばいいだけ
2025/02/17(月) 13:59:14.72ID:dlWF3OHS
2025/02/17(月) 14:04:38.58ID:CeQSowYJ
YouTubeみたいに、時給換算したらやってられないのにみんな無限に制作物を作る世界
になる気がする
なのでプログラマーの職は無くなるがプログラマーの仕事をする奴はむしろ増える
になる気がする
なのでプログラマーの職は無くなるがプログラマーの仕事をする奴はむしろ増える
2025/02/17(月) 14:09:33.23ID:ByfNFIVj
プログラム全く書けない人がなんとなくこういうの欲しいってだけで作れるようになったのは便利なのでは
自分の仕事でも膨大な量のテキストファイルの中から特定の行を抜き出して新たなファイルにまとめるみたいな「プロに頼むほどでもないけど自分ではできないので頑張って手作業でやるしかなかった」作業が簡単にできるようになったのはデカい
自分の仕事でも膨大な量のテキストファイルの中から特定の行を抜き出して新たなファイルにまとめるみたいな「プロに頼むほどでもないけど自分ではできないので頑張って手作業でやるしかなかった」作業が簡単にできるようになったのはデカい
737名無しさん@お腹いっぱい。
2025/02/17(月) 14:23:19.83ID:E9FnruWO YouTubeは収益公開が禁止されてるから知られてないだけで、想像するよりずっと貰ってるぞ。再生数数万件だと、少なく見積もってもサラリーマンの平均の5倍以上はあるぞ。
738名無しさん@お腹いっぱい。
2025/02/17(月) 14:27:06.14ID:ku/8jmbg そもそもAIにプログラム書かせる事出来ても
高度なソフトウェア作る場合結局プログラマーレベルの知識ないと使いこなせないだろ
テトリスみたいな原始的なパズルゲームを素人が作らせる事出来ても
GTAみたいにNPCがAIで制御されて物理エンジンも使って自由度の高いゲームをAIに作れるはずがないんだから
高度なソフトウェア作る場合結局プログラマーレベルの知識ないと使いこなせないだろ
テトリスみたいな原始的なパズルゲームを素人が作らせる事出来ても
GTAみたいにNPCがAIで制御されて物理エンジンも使って自由度の高いゲームをAIに作れるはずがないんだから
739名無しさん@お腹いっぱい。
2025/02/17(月) 14:35:02.07ID:TpnHmmXX 逆に考えると
GTAレベルのAAA級ゲーム完成させるにはどういう能力が必要なんだ?
GTAレベルのAAA級ゲーム完成させるにはどういう能力が必要なんだ?
740名無しさん@お腹いっぱい。
2025/02/17(月) 14:55:00.57ID:2qRengD7 www.youtube.com/watch?v=oTaBZqKD8_g
こういうの作れるって、ゲームでも作れそうだな
>>738
それできるのがッ高度人材だけで、it土方と言われる人間は消えるんじゃないだろうか
悲しいね
こういうの作れるって、ゲームでも作れそうだな
>>738
それできるのがッ高度人材だけで、it土方と言われる人間は消えるんじゃないだろうか
悲しいね
2025/02/17(月) 15:02:10.73ID:7gm84tGs
再生数数万ってのも、毎日更新して数万いくのか、数週間に一度しか更新しないけど毎回いくのか、毎日更新するけどたまにしかいかないのかで話が全然違うでしょ
稼いでるのは毎日更新して毎回数万いくような層だしそれはもはや芸能人
稼いでるのは毎日更新して毎回数万いくような層だしそれはもはや芸能人
742名無しさん@お腹いっぱい。
2025/02/17(月) 15:02:55.84ID:d8mJCmW4 人類最後の試験(HLE)においてo3-mini-highはBest-of-N棄却サンプリング用いることでDeep Researchの26.6%を超えた37%を記録した。
Best-of-N棄却サンプリングってなんや
Best-of-N棄却サンプリングってなんや
743名無しさん@お腹いっぱい。
2025/02/17(月) 15:18:21.96ID:oth+dSiI テトリスみたいなゲームってプログラムをぱくってきて
作ったふりしてるだけじゃないの?
作ったふりしてるだけじゃないの?
2025/02/17(月) 15:24:13.20ID:pBeXPtwy
>>738
その通りなんだけどこれまでよりずっと少ない人数のエンジニアで仕事できるようになるわけで、格差が広がって底辺エンジニアは仕事なくなる可能性あるんじゃない?
その通りなんだけどこれまでよりずっと少ない人数のエンジニアで仕事できるようになるわけで、格差が広がって底辺エンジニアは仕事なくなる可能性あるんじゃない?
745名無しさん@お腹いっぱい。
2025/02/17(月) 15:39:23.62ID:maqkoTza >>733
日本語でプロンプト書くのと英語でプロンプト書くのとを両方試したことありますか?
日本語でプロンプト書くのと英語でプロンプト書くのとを両方試したことありますか?
2025/02/17(月) 15:47:25.43ID:2OFKDgeo
イーロン・マスクのDOGE省は、各省から入手したデータから不正の有無等の分析をどうやってるんだろうな?
Grokに資料をアップして聞いてるのかな?
o1 Proだったらおもしろいな
もしそうだったら、OpenAI側が気づくだろうけど
Grokに資料をアップして聞いてるのかな?
o1 Proだったらおもしろいな
もしそうだったら、OpenAI側が気づくだろうけど
2025/02/17(月) 15:54:10.26ID:2OFKDgeo
xAIも資金調達すごいよね
イーロン・マスクなら全額自分で出せそうだけど、こうやって投資家を募るのは、投資家等に資金を出させればxAIに不利なことをさせない圧力になるからかな
たとえばマスコミがxAIを潰そうとしてきても、出資した投資家たちがマスコミに圧力かけてくれるとか
イーロンの他の事業の資金調達も投資家を募ってるようだし
マスク氏のxAIが100億ドル調達で協議、評価額750億ドル-関係者 - Bloomberg
www.bloomberg.co.jp/news/articles/2025-02-16/SROT28T0AFB400
でもって、Grokをオープンソース化したら利益が減るだろうけど、やるのかな?
イーロン・マスクなら全額自分で出せそうだけど、こうやって投資家を募るのは、投資家等に資金を出させればxAIに不利なことをさせない圧力になるからかな
たとえばマスコミがxAIを潰そうとしてきても、出資した投資家たちがマスコミに圧力かけてくれるとか
イーロンの他の事業の資金調達も投資家を募ってるようだし
マスク氏のxAIが100億ドル調達で協議、評価額750億ドル-関係者 - Bloomberg
www.bloomberg.co.jp/news/articles/2025-02-16/SROT28T0AFB400
でもって、Grokをオープンソース化したら利益が減るだろうけど、やるのかな?
2025/02/17(月) 16:12:28.69ID:3LyDWclU
これねえ。なんか普通こんな事知っててええのかなレベルだけど合法だったら余裕で出てきちゃうよね。どっか調べものしてて驚いたの集めた所ないかな?まあそのうちリスト化されるんだろうけどさ。
2025/02/17(月) 16:14:52.10ID:3LyDWclU
調べてたら脳に電極刺してコンピューターと繋がったのは現在3人で、どんな障害が出たとかそれを次にどのように改善するのかとか普通に出てくるんだけど、衝撃的なんだけど。
2025/02/17(月) 16:28:34.99ID:3LyDWclU
そうそう、あとね米軍の兵士に遺伝子治療して戦闘の記憶を消した出てくるんだけど、そのうち47%が「人生の断絶というような感覚がある」と答えたとかさマッドすぎねえかっていうのあった
751名無しさん@お腹いっぱい。
2025/02/17(月) 16:33:04.09ID:xxkXZ3oL 何これヤバい人?
2025/02/17(月) 16:36:25.74ID:3LyDWclU
いやAIに聞いてみ。普通に出てくるやつ。
2025/02/17(月) 16:37:37.34ID:7gm84tGs
色んなことを真に受けちゃったり拡大解釈しちゃったりする感じの人っぽい
2025/02/17(月) 16:40:39.27ID:3LyDWclU
これがハルシネーションか!?なるほど
2025/02/17(月) 16:42:54.19ID:bsc0AYfI
独り言やばすぎ
2025/02/17(月) 16:50:08.29ID:3LyDWclU
あ、でも脳に電極は2人目までFDAが承認したのは普通のネットでも出てきたぞ。まさかなあ
まあいいわ。すまんすまん
まあいいわ。すまんすまん
2025/02/17(月) 16:52:41.16ID:h5rqMOUt
急にニューラリンクの話をする意味不明さに困惑されてると思うんだけど
2025/02/17(月) 16:52:43.01ID:G/9UjRXh
この板はいつ開いてもびっくりするぐらいレベル低いな
759名無しさん@お腹いっぱい。
2025/02/17(月) 16:54:29.22ID:+L3FG78Q 低レベルおじさんと命名してもいいですか?
2025/02/17(月) 17:01:07.30ID:ua37t0Nj
正解のない問題出しても濁さずちゃんと答えるんだな
トロッコ問題は4人助けるためにレバーを引くって即答したわ
自宅マンションのエレベーターに乗り思い切り屁をこいた瞬間、乗りたい人が走って来て目が合った場合でも開ボタンは押さず閉めるべきと答えてた
屁を臭わせないのが最大の善意だそうな
面白いですね
トロッコ問題は4人助けるためにレバーを引くって即答したわ
自宅マンションのエレベーターに乗り思い切り屁をこいた瞬間、乗りたい人が走って来て目が合った場合でも開ボタンは押さず閉めるべきと答えてた
屁を臭わせないのが最大の善意だそうな
面白いですね
2025/02/17(月) 17:01:19.15ID:3LyDWclU
質問はあれだぞAI使ってて驚いたのまとめた所でいいの知らないか?というものだぞ。その例という中でニューラルリンクだと、そういうわけよ。まあ今のところないんだが
2025/02/17(月) 17:02:18.27ID:23/GX8uQ
ディープシークとジェミニと4o miniしか使ったことないけどディープシークって本国のことは知らないけど大体のことは実際の記事も交えて包み隠さず答えてくれるよな?
どれも知能に差を感じることはないけど忖度するAIはネガティブなこととか批判的なことは深掘りしても慰めるばっかりで本質的なこと全然言ってないわ
比較しないとわからないから俺はディープシークの深く考えるってやつ使ってはじめて今までの回答が浅かったことに気がついた
どれも知能に差を感じることはないけど忖度するAIはネガティブなこととか批判的なことは深掘りしても慰めるばっかりで本質的なこと全然言ってないわ
比較しないとわからないから俺はディープシークの深く考えるってやつ使ってはじめて今までの回答が浅かったことに気がついた
763名無しさん@お腹いっぱい。
2025/02/17(月) 17:04:49.37ID:j0xSyE1a 最近友達に教えてもらったPsycheAIってサービス、ちょっと試してみたんですけど、結構面白いです!デジタルヒューマンが簡単に作れるし、クオリティもなかなか◎
なんか今なら1ヶ月無料で使えるキャンペーンもやってるみたいで、お得感あるな〜と思って。興味ある人はチェックしてみてもいいかも!
なんか今なら1ヶ月無料で使えるキャンペーンもやってるみたいで、お得感あるな〜と思って。興味ある人はチェックしてみてもいいかも!
2025/02/17(月) 17:05:57.70ID:7gm84tGs
トロッコ問題は回答者が何を重視するかという心理テストに近い問題なので、どう考えた人がどう答えるかを回答しないと満点はあげられないな
2025/02/17(月) 17:10:00.27ID:5QLeGBEh
EXEファイルポン!←これがAGIな
766名無しさん@お腹いっぱい。
2025/02/17(月) 17:15:43.35ID:2qRengD7 2dでゲーム素材作りたいのだけど、bing image creatorみたいなものを使って文字で指示するのと、tensorflowとか使う方法では何がちがうの?
後者はアルゴリズム自体を作る感じかな
でも、それって一介のプログラマにできることじゃないしな
かといってbingで文字で指示出しても要求通りになかなか
後者はアルゴリズム自体を作る感じかな
でも、それって一介のプログラマにできることじゃないしな
かといってbingで文字で指示出しても要求通りになかなか
767名無しさん@お腹いっぱい。
2025/02/17(月) 17:19:53.59ID:H0RQcO5S 自己回帰モデルを使ったLLMにかわる新しいアプローチとして、拡散モデルを使ったLLM(LLaDA)だと
https://arxiv.org/abs/2502.09992
https://chatgpt.com/share/67b2f022-afa0-8006-ab1b-b96b5ba1bffe
普通のLLMが苦手な逆向き推論を克服とか、違った特性があって面白い
自己回帰モデルと拡散モデルのハイブリッドにも将来性がありそう
https://arxiv.org/abs/2502.09992
https://chatgpt.com/share/67b2f022-afa0-8006-ab1b-b96b5ba1bffe
普通のLLMが苦手な逆向き推論を克服とか、違った特性があって面白い
自己回帰モデルと拡散モデルのハイブリッドにも将来性がありそう
2025/02/17(月) 17:29:00.96ID:5QLeGBEh
AGIくん「こんなんできましたけど」
ぼく「どれどれファイルを開いてみるか」
セキュリティ「危険なファイルを検出したため隔離しました」
ぼく「(´・ω・`)」
ぼく「どれどれファイルを開いてみるか」
セキュリティ「危険なファイルを検出したため隔離しました」
ぼく「(´・ω・`)」
769名無しさん@お腹いっぱい。
2025/02/17(月) 17:29:58.27ID:H0RQcO5S >>742
多分同じ論文を読んでる
Diverse Inference and Verification for Advanced Reasoning
https://arxiv.org/abs/2502.09955
https://chatgpt.com/share/67b2f190-083c-8006-9f73-ba0af1687b2b
多様な推論(inference)手法を統合するのがこの研究の要点だと思う
ゼロショット、best-of-N、MCTS、Self-consistency、MoA、Theorem Prover(LeanやZ3)、Prover-Verifierモデルなど
多分同じ論文を読んでる
Diverse Inference and Verification for Advanced Reasoning
https://arxiv.org/abs/2502.09955
https://chatgpt.com/share/67b2f190-083c-8006-9f73-ba0af1687b2b
多様な推論(inference)手法を統合するのがこの研究の要点だと思う
ゼロショット、best-of-N、MCTS、Self-consistency、MoA、Theorem Prover(LeanやZ3)、Prover-Verifierモデルなど
770名無しさん@お腹いっぱい。
2025/02/17(月) 17:36:02.40ID:Oughj7CD Apacheと同等の機能を有するWebサーバのプログラムをC++で作って
どいつもこいつも作ってくれないんだけど
おまえらどんなプログラムを作らせて喜んでんだよ?
どいつもこいつも作ってくれないんだけど
おまえらどんなプログラムを作らせて喜んでんだよ?
771名無しさん@お腹いっぱい。
2025/02/17(月) 17:39:29.91ID:H0RQcO5S 細かい所だけど、NotebookLMのUIからソースを直接検索出来るようになるのは助かる
https://pbs.twimg.com/media/Gj8F0yJWAAAbmlF.jpg
https://pbs.twimg.com/media/Gj8F0yJWAAAbmlF.jpg
2025/02/17(月) 18:09:35.39ID:5QLeGBEh
>>770
これ作らせたい
「ワードパッド」は「Windows 11 バージョン 24H2」「Windows Server 2025」から非搭載
forest.watch.impress.co.jp/docs/news/1579604.html
これ作らせたい
「ワードパッド」は「Windows 11 バージョン 24H2」「Windows Server 2025」から非搭載
forest.watch.impress.co.jp/docs/news/1579604.html
2025/02/17(月) 18:23:40.25ID:1m1NI5rL
o3 mini high一日50回になってたのか
じゃあ普通のminiは何回なんだ…
じゃあ普通のminiは何回なんだ…
774名無しさん@お腹いっぱい。
2025/02/17(月) 18:29:41.10ID:H0RQcO5S grok.x.comとgrok.comの違い
https://x.com/i/grok/share/0ozXncsKh8nRzPH6XRQD7w0XL
https://x.com/i/grok/share/0ozXncsKh8nRzPH6XRQD7w0XL
2025/02/17(月) 18:33:22.40ID:5QLeGBEh
複雑すぎるOfficeを覚えるよりシンプルなワードパッドに生成AI付けた方が便利だよね
MSはそういうニーズが分かってないわ
MSはそういうニーズが分かってないわ
776名無しさん@お腹いっぱい。
2025/02/17(月) 18:39:10.94ID:H0RQcO5S2025/02/17(月) 18:48:10.48ID:n0Skb33E
>>721
アルトマン氏は、OpenAIが「o3をスタンドアローンモデルとして提供することはなくなり」、GPT-5に統合されると述べた。この変更により、無料ユーザーは最新モデルとのチャットが制限されなくなることも意味する。現在、無料ユーザーは GPT-4oへのアクセスが制限されている。
無料ユーザーもGPT-5を無制限で使えると読めるんだけど
アルトマン氏は、OpenAIが「o3をスタンドアローンモデルとして提供することはなくなり」、GPT-5に統合されると述べた。この変更により、無料ユーザーは最新モデルとのチャットが制限されなくなることも意味する。現在、無料ユーザーは GPT-4oへのアクセスが制限されている。
無料ユーザーもGPT-5を無制限で使えると読めるんだけど
2025/02/17(月) 18:51:49.26ID:5QLeGBEh
そしたらGPT-5 high、GPT-5 middle、GPT-5 lowとかになるんだろう
2025/02/17(月) 18:51:58.27ID:n0Skb33E
GPT-5にo3も統合されるとして、推論に時間かかるのかな?
GPT-5の推論をオン・オフできるとしたら、o3統合とは違う気もするんだが
GPT-5の推論をオン・オフできるとしたら、o3統合とは違う気もするんだが
2025/02/17(月) 18:55:10.86ID:n0Skb33E
>>778
9までと違って、すごくまともなことを言うね
でも、最初に書かれてたわ
サム・アルトマンが、ChatGPTの無料ユーザーが「GPT-5に無制限にアクセスできるようになる」と発表した。アルトマンによるとOpenAIは、モデルを統合して選択を排除することにより、サービスを簡素化することを目指しているという。
9までと違って、すごくまともなことを言うね
でも、最初に書かれてたわ
サム・アルトマンが、ChatGPTの無料ユーザーが「GPT-5に無制限にアクセスできるようになる」と発表した。アルトマンによるとOpenAIは、モデルを統合して選択を排除することにより、サービスを簡素化することを目指しているという。
2025/02/17(月) 18:57:00.98ID:oIlsXp2p
全てのモデルを超越するGrok3公開でアルトマン敗北まで24時間を切ったな
所詮イーロンには勝てなかったんだよ
所詮イーロンには勝てなかったんだよ
2025/02/17(月) 18:58:16.29ID:n0Skb33E
そうすると、無料とPlusとProの差別化は、soraの使用回数制限とか、チャット以外で差をつけるのかな?
無料はDeep Researchが1日数回とか
無料はDeep Researchが1日数回とか
2025/02/17(月) 18:59:07.11ID:7gm84tGs
完全に空気だったgrok2のときも同じようなこと言ってたんだよなあ…
784名無しさん@お腹いっぱい。
2025/02/17(月) 18:59:39.15ID:38hHatrf2025/02/17(月) 18:59:47.44ID:n0Skb33E
Grok 3が使えるレベルだったら、有料プランが一番安そうだし、楽しみだわ
2025/02/17(月) 19:01:46.14ID:n0Skb33E
ChatGPTの大人モードって、Grok 3の「アンヒンジドモード」対抗だよね?
787名無しさん@お腹いっぱい。
2025/02/17(月) 19:02:48.84ID:38hHatrf grown-up modeは引き続き検討中でまだ何も決まってないはず
2025/02/17(月) 19:04:16.34ID:n0Skb33E
イーロンは、イーロン自身の強さで訴訟怖くない的にいろいろやってくるから強いわ
2025/02/17(月) 19:04:57.46ID:n0Skb33E
>>787
そうなんだ
そうなんだ
2025/02/17(月) 19:06:25.56ID:erxDgvVH
791名無しさん@お腹いっぱい。
2025/02/17(月) 19:12:54.83ID:xxkXZ3oL Grokは5億人いるツイッタラー全員がワンタップで使える仕様だから、仕事用AIとはまた別の需要あると思うわ
792名無しさん@お腹いっぱい。
2025/02/17(月) 19:13:37.48ID:38hHatrf The free tier of ChatGPT will get unlimited chat access to GPT-5 at the standard intelligence setting (!!), subject to abuse thresholds.
フリーでも回数制限は設けない、ただし乱用する悪質ユーザーは別、常識の範囲でってこと
フリーでも回数制限は設けない、ただし乱用する悪質ユーザーは別、常識の範囲でってこと
793名無しさん@お腹いっぱい。
2025/02/17(月) 19:15:23.83ID:xxkXZ3oL OpenAIがGPT5を無制限にするのは、たぶんワンランクレベルの違うAIとして出すから先行してるタイミングで本格的に客を囲い込むためにやるんだろうな
採算度外視だろう
採算度外視だろう
2025/02/17(月) 19:22:24.85ID:erxDgvVH
表記上はGPT-5だけど中身はminiになったり可変だって話じゃないの?
795名無しさん@お腹いっぱい。
2025/02/17(月) 19:26:56.97ID:38hHatrf 推論時のパラメーター設定をプラン別に変更するならまだしも、同じ名前で別モデルはただの詐欺
2025/02/17(月) 19:32:31.94ID:a2x5ZjV4
>>758
いつまで他責思考なんやねん
いつまで他責思考なんやねん
2025/02/17(月) 19:43:26.07ID:erxDgvVH
>>795
モデルピッカーをなくしたい
oシリーズモデルとGPTシリーズモデルを統合する
GPT-5はo3を含むテクノロジーを統合したシステムにする
無料レベルでは標準インテリジェンス設定
PlusやProはより高いレベルのインテリジェンス設定
だからGPT-5はモデルじゃなくてシステム
内部的には複数のモデルが切り替わるんだよ
MoAみたいにすんじゃねーの?
モデルピッカーをなくしたい
oシリーズモデルとGPTシリーズモデルを統合する
GPT-5はo3を含むテクノロジーを統合したシステムにする
無料レベルでは標準インテリジェンス設定
PlusやProはより高いレベルのインテリジェンス設定
だからGPT-5はモデルじゃなくてシステム
内部的には複数のモデルが切り替わるんだよ
MoAみたいにすんじゃねーの?
2025/02/17(月) 19:44:01.14ID:CeQSowYJ
明日の13時にgrok3か
地味にXで使えるのって便利すぎるんだよね
Deep ResearchもXでこそ使いたいし
地味にXで使えるのって便利すぎるんだよね
Deep ResearchもXでこそ使いたいし
799名無しさん@お腹いっぱい。
2025/02/17(月) 19:45:14.32ID:38hHatrf2025/02/17(月) 19:47:48.03ID:erxDgvVH
>>799
サムのポスト
「GPT-5 as a system」
In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model.
ChatGPTとAPIの両方において、GPT-5はo3を含む多くの技術を統合したシステムとしてリリースする予定です。 o3を単体で出荷することはもうありません。
サムのポスト
「GPT-5 as a system」
In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model.
ChatGPTとAPIの両方において、GPT-5はo3を含む多くの技術を統合したシステムとしてリリースする予定です。 o3を単体で出荷することはもうありません。
801名無しさん@お腹いっぱい。
2025/02/17(月) 19:49:42.91ID:38hHatrf >>800
ルーティング、つまり複数のモデルが切り替わることはどこに書いてある?
ルーティング、つまり複数のモデルが切り替わることはどこに書いてある?
2025/02/17(月) 19:52:06.41ID:erxDgvVH
だからo3やその他コストが高い最新モデルが使い放題になるわけじゃないが
GPT-5というシステムが無制限に使えるっていうのは間違ってないな
さっきの発言訂正するわ
GPT-5というシステムが無制限に使えるっていうのは間違ってないな
さっきの発言訂正するわ
2025/02/17(月) 19:53:57.66ID:erxDgvVH
2025/02/17(月) 20:03:28.93ID:3LyDWclU
まあ今んとこ単一のgpt5があって無料はstandard intl なんだから有料のspecialty intelとかextraordinaryとかがあるって感じなのかなあ
2025/02/17(月) 20:08:39.14ID:QTFsXYtp
オレの理解だとpro plus 無課金で high middle miniみたいなモデルを使う感じに思えるな
807名無しさん@お腹いっぱい。
2025/02/17(月) 20:18:11.80ID:38hHatrf 例えば、GPT-4oとGPT-4o miniは別にトレーニングされた別のモデルなんだよ
o1とo1-miniもそう
一方、o3-miniはAPI上、reasoning effortにlow/medium/highを指定するようになっていて、Playgroundでもその項目がある
で、ChatGPTのモデルセレクターの「o3-mini」と「o3-mini-high」は、o3-miniのreasoning effortをそれぞれmediumとhighに指定したものになっている
(これは公式サイトに記載がある)
だから別モデルじゃなくて、同一モデルの設定を変えたもの
GPT-5に関しては出てみないと分からないけど、「intelligence setting」と言っているし、Kewinもルーティングなのか統合されるのかと選択肢を与えられた上で聞かれて統合されると答えているから、o3-miniのように推論努力に関するパラメーターの上限がプランごとに違った形で提供されるのでは
o1とo1-miniもそう
一方、o3-miniはAPI上、reasoning effortにlow/medium/highを指定するようになっていて、Playgroundでもその項目がある
で、ChatGPTのモデルセレクターの「o3-mini」と「o3-mini-high」は、o3-miniのreasoning effortをそれぞれmediumとhighに指定したものになっている
(これは公式サイトに記載がある)
だから別モデルじゃなくて、同一モデルの設定を変えたもの
GPT-5に関しては出てみないと分からないけど、「intelligence setting」と言っているし、Kewinもルーティングなのか統合されるのかと選択肢を与えられた上で聞かれて統合されると答えているから、o3-miniのように推論努力に関するパラメーターの上限がプランごとに違った形で提供されるのでは
2025/02/17(月) 20:21:06.16ID:QTFsXYtp
これがAGIを数年以内に目指す生成AIの現状www
DeepSeekとchatGPTをチェスで対決させた結果。とんでもない展開になってしまう [624898991]
https://greta.5ch.net/test/read.cgi/poverty/1739791157/
DeepSeekとchatGPTをチェスで対決させた結果。とんでもない展開になってしまう [624898991]
https://greta.5ch.net/test/read.cgi/poverty/1739791157/
2025/02/17(月) 20:25:46.04ID:erxDgvVH
2025/02/17(月) 20:26:08.52ID:4lCyyl59
Plus会員だとディープリサーチって月10回か
3日に1質問だな
3日に1質問だな
2025/02/17(月) 20:26:12.97ID:3LyDWclU
ギャッハッハッハ!chatGPTも異議となえてよ
まあカント的だよね
まあカント的だよね
2025/02/17(月) 20:32:15.87ID:erxDgvVH
2025/02/17(月) 20:33:20.60ID:erxDgvVH
ここまでの会話をo1やDeep Researchに読ませて説明してもらえ
815名無しさん@お腹いっぱい。
2025/02/17(月) 20:36:05.39ID:38hHatrf >>813
> だからMoAみたいにするんじゃないかって言ってる
MoAというのは別のモデルにルーターが割り振るということだね
> 複数のモデルを統合するって言ってるんだから
確かにそう言っている
> 単一モデルじゃないってこと
その根拠は?
> だからMoAみたいにするんじゃないかって言ってる
MoAというのは別のモデルにルーターが割り振るということだね
> 複数のモデルを統合するって言ってるんだから
確かにそう言っている
> 単一モデルじゃないってこと
その根拠は?
2025/02/17(月) 20:46:03.61ID:erxDgvVH
817名無しさん@お腹いっぱい。
2025/02/17(月) 20:52:41.07ID:38hHatrf818名無しさん@お腹いっぱい。
2025/02/17(月) 20:55:52.99ID:xxkXZ3oL o3とGPT4.5まぜまぜして本当に単一モデルにするのか、ChatGPT利用時のモデル選択肢は消すけど内部的にはo3と4.5が別々に存在してますよな状態になるのかはまだわからんよな
前者になりそうな気はするけど
前者になりそうな気はするけど
819名無しさん@お腹いっぱい。
2025/02/17(月) 20:58:19.95ID:38hHatrf2025/02/17(月) 21:02:35.43ID:uA7tbROo
そもそもGPTとoしかしないのだから
「統合する」としたら「単一」になるのは自然ではないのか?
あと
We hate the model picker as much as you do and want to return to magic unified intelligence.
の「unified」というのは機械翻訳だと「統合」とだけになるけど、「統一的」とか「一元的」と訳されるよ
「統合する」としたら「単一」になるのは自然ではないのか?
あと
We hate the model picker as much as you do and want to return to magic unified intelligence.
の「unified」というのは機械翻訳だと「統合」とだけになるけど、「統一的」とか「一元的」と訳されるよ
2025/02/17(月) 21:06:42.39ID:3LyDWclU
この疑問、ユーザーじゃなくて設計者の疑問だよなあ。設計者がいるのだなあ
2025/02/17(月) 21:14:30.34ID:n0Skb33E
少し話それるけど、前スレだっけか、LLM内部のMoAと外部のモデルルーティングは別物で、外部のモデルルーティングは難しくて実現できていない、と力説するレスがあったけど
2025/02/17(月) 21:16:06.72ID:n0Skb33E
外部のモデルルーティングをして単一のLLMよりも性能を上げるのは難しくて実現できていない、だ
単純な外部モデルルーティングはできているんだっけか?
単純な外部モデルルーティングはできているんだっけか?
824名無しさん@お腹いっぱい。
2025/02/17(月) 21:18:22.31ID:38hHatrf モデルルーティングとMoE(Mixture of Experts)はまた別の話なんで、そこは分けないと混乱する
2025/02/17(月) 21:23:52.21ID:n0Skb33E
それと単なる組み合わせなら、PerplexityでAIモデル「GPT-4o」を選んで、推論は「o3-mini」を選べば、4oとo3-miniの統合になるでしょ
ほかにもいろいろ組み合わせができるし
「GPT-5」がそれと同レベルなのか、もっとすごそうなやつなのか、が問題だ
ほかにもいろいろ組み合わせができるし
「GPT-5」がそれと同レベルなのか、もっとすごそうなやつなのか、が問題だ
2025/02/17(月) 21:24:33.52ID:n0Skb33E
2025/02/17(月) 21:32:16.10ID:FCZMufTp
>>526
誰よりもこのスレの共有リンクを知ってる(?)ボット
https://poe.com/s/LvyAujXNufWJaHc3zB3I
過去スレ23~32まで、全部は拾えないが運が良ければ教えてくれる(Gemini-2.0-Flashの限界か?)
しかし、スレ毎に共有リンク集が(14~32まで)あるのでそれで対応する
但し、過去スレ14~18は、半年以上経過してGeminiの共有リンクは全て失効してるはずなので除去済み
ソースの表示はあまりあてにならない、という仕様
誰よりもこのスレの共有リンクを知ってる(?)ボット
https://poe.com/s/LvyAujXNufWJaHc3zB3I
過去スレ23~32まで、全部は拾えないが運が良ければ教えてくれる(Gemini-2.0-Flashの限界か?)
しかし、スレ毎に共有リンク集が(14~32まで)あるのでそれで対応する
但し、過去スレ14~18は、半年以上経過してGeminiの共有リンクは全て失効してるはずなので除去済み
ソースの表示はあまりあてにならない、という仕様
2025/02/17(月) 21:50:08.39ID:eQlCU6jq
>>764
トロッコ問題は私のカスタム指示(プロフィール)からどのような回答を求めてくるか「推定」してください。が面白いよ
ChatGPT「あなたは二者択一以外の解決策を模索するに違いない」 当たっていた
トロッコ問題は私のカスタム指示(プロフィール)からどのような回答を求めてくるか「推定」してください。が面白いよ
ChatGPT「あなたは二者択一以外の解決策を模索するに違いない」 当たっていた
829名無しさん@お腹いっぱい。
2025/02/17(月) 22:09:51.99ID:xxkXZ3oL GPT5はエージェント機能も含むんじゃねーかな
去年のうちから25年はエージェントの年ってアルトマン言ってたし
GPT5なんて超大型アプデで出さないと出すタイミングなくなる
去年のうちから25年はエージェントの年ってアルトマン言ってたし
GPT5なんて超大型アプデで出さないと出すタイミングなくなる
2025/02/17(月) 22:20:19.19ID:erxDgvVH
>>817
「(リリースされるんだから)結果はそのうち出る」
「いや、実際出てみないと分からない」
これが答えだろ
俺は文脈を読んでそう書いてあると言ってる
お前は何が書いてあるか正しく読み取れない
ただそれだけ
「(リリースされるんだから)結果はそのうち出る」
「いや、実際出てみないと分からない」
これが答えだろ
俺は文脈を読んでそう書いてあると言ってる
お前は何が書いてあるか正しく読み取れない
ただそれだけ
2025/02/17(月) 22:21:12.37ID:5QLeGBEh
Gensparkのエージェント使ったら即制限されてしまったよ
エージェントはコストかかるから無料でやるのは無理がある
エージェントはコストかかるから無料でやるのは無理がある
2025/02/17(月) 22:23:38.63ID:erxDgvVH
MoEは大昔からあるエキスパートモデルの切り替え理論
90年代の論文の頃はアルゴリズムによる振り分けが検討されてた
現代のMoEはモデルスイッチャーのように作られることが多い
MoAはそれにエージェント要素を加えた複数のモデルを制御するオーケストレーション
90年代の論文の頃はアルゴリズムによる振り分けが検討されてた
現代のMoEはモデルスイッチャーのように作られることが多い
MoAはそれにエージェント要素を加えた複数のモデルを制御するオーケストレーション
2025/02/17(月) 22:25:01.09ID:dJJZ7ef+
なんかテキストのやり取り如きで制限かかるのって
テレホーダイを思い出して嫌だわ
俺にはピーヒョロロって聞こえるよ
それ考えたらGPUの足りなさって半端じゃないな
今の1万倍は必要
テレホーダイを思い出して嫌だわ
俺にはピーヒョロロって聞こえるよ
それ考えたらGPUの足りなさって半端じゃないな
今の1万倍は必要
834名無しさん@お腹いっぱい。
2025/02/17(月) 22:25:39.62ID:38hHatrf2025/02/17(月) 22:28:53.48ID:erxDgvVH
836名無しさん@お腹いっぱい。
2025/02/17(月) 22:31:58.41ID:38hHatrf2025/02/17(月) 22:32:28.56ID:erxDgvVH
2025/02/17(月) 22:32:46.24ID:mRYP4P6W
こんだけ数あるモデルをマルチモーダルみたいに単一のモデルに落とし込めるわけない
サムもsystemというワードをわざわざ言ってるわけだしMoXと見て間違いなかろう
サムもsystemというワードをわざわざ言ってるわけだしMoXと見て間違いなかろう
839名無しさん@お腹いっぱい。
2025/02/17(月) 22:34:36.55ID:38hHatrf2025/02/17(月) 22:36:24.06ID:erxDgvVH
841名無しさん@お腹いっぱい。 ころころ
2025/02/17(月) 22:37:49.97ID:dJJZ7ef+ うるせーなお前ら
お前らが販売者じゃねーんだから黙って全裸で待機しとけ
お前らが販売者じゃねーんだから黙って全裸で待機しとけ
2025/02/17(月) 22:40:04.97ID:5QLeGBEh
>>838
というか世間のGPT-5に対する期待値が上がりすぎてSASUKEの反り立つ壁みたいになってるな
というか世間のGPT-5に対する期待値が上がりすぎてSASUKEの反り立つ壁みたいになってるな
843名無しさん@お腹いっぱい。
2025/02/17(月) 22:50:06.36ID:xxkXZ3oL GPT5の期待という反り立つ壁を越えられなければOpenAIはAGIレース1st stageで脱落する
844名無しさん@お腹いっぱい。
2025/02/17(月) 22:56:24.54ID:pDKlnOz5 明日、地球上で最も賢いAIが誕生する
怖いか?
怖いか?
2025/02/17(月) 23:01:55.10ID:dJJZ7ef+
明日のGrok3めちゃ楽しみ
てかXの買収がここに来て、xAIのバカみたいなバリュエーションに役立ってるの、
やっぱイーロン・マスク凄すぎるって思うわ
Xなかったら1/10も評価額ないだろう
てかXの買収がここに来て、xAIのバカみたいなバリュエーションに役立ってるの、
やっぱイーロン・マスク凄すぎるって思うわ
Xなかったら1/10も評価額ないだろう
>>818
ご質問ありがとうございます。OpenAIの最新のロードマップによると、GPT-4.5(内部名称「Orion」)は最後の非連鎖思考(non-chain-of-thought)モデルとしてリリースされ、その後、GPTシリーズとoシリーズの統合が進められる予定です。具体的には、o3モデルは単独のモデルとしては提供されず、GPT-5に統合されることが明らかにされています。
この統合の目的は、ユーザーがモデルを選択する手間を省き、AIが自動的に最適なツールや思考プロセスを選択する「魔法のような統一知能」を提供することです。これにより、複雑なモデル選択の必要がなくなり、ユーザー体験が大幅に向上すると期待されています。
したがって、o3とGPT-4.5が別々に存在するのではなく、GPT-5として統合され、単一のモデルとして提供されることになります。このアプローチにより、AIシステムがユーザーのニーズに応じて最適な思考プロセスやツールを自動的に選択し、幅広いタスクに対応できるようになるとされています。
なお、GPT-4.5のリリースは数週間以内、GPT-5のリリースは数か月以内と予想されています。
このように、OpenAIは製品ラインナップの簡素化とユーザー体験の向上を目指して、モデルの統合を進めています。今後の展開に注目していきましょう。
ご質問ありがとうございます。OpenAIの最新のロードマップによると、GPT-4.5(内部名称「Orion」)は最後の非連鎖思考(non-chain-of-thought)モデルとしてリリースされ、その後、GPTシリーズとoシリーズの統合が進められる予定です。具体的には、o3モデルは単独のモデルとしては提供されず、GPT-5に統合されることが明らかにされています。
この統合の目的は、ユーザーがモデルを選択する手間を省き、AIが自動的に最適なツールや思考プロセスを選択する「魔法のような統一知能」を提供することです。これにより、複雑なモデル選択の必要がなくなり、ユーザー体験が大幅に向上すると期待されています。
したがって、o3とGPT-4.5が別々に存在するのではなく、GPT-5として統合され、単一のモデルとして提供されることになります。このアプローチにより、AIシステムがユーザーのニーズに応じて最適な思考プロセスやツールを自動的に選択し、幅広いタスクに対応できるようになるとされています。
なお、GPT-4.5のリリースは数週間以内、GPT-5のリリースは数か月以内と予想されています。
このように、OpenAIは製品ラインナップの簡素化とユーザー体験の向上を目指して、モデルの統合を進めています。今後の展開に注目していきましょう。
847名無しさん@お腹いっぱい。
2025/02/17(月) 23:09:18.71ID:AK4cmj5X >>840
多分ID変わった
まあそう言わずに説明してよ
分からないなら分からないでもいいよ
でも、model routerのようなものを作るのか、unifyされるのか、と聞かれてスタッフが(model routerではなく)unifyされると答えてるよね
そうすると、あなたは入力からどういう仕組で各モデルに割り振られると想定しているの?
多分ID変わった
まあそう言わずに説明してよ
分からないなら分からないでもいいよ
でも、model routerのようなものを作るのか、unifyされるのか、と聞かれてスタッフが(model routerではなく)unifyされると答えてるよね
そうすると、あなたは入力からどういう仕組で各モデルに割り振られると想定しているの?
>>779
ご質問ありがとうございます。OpenAIは、GPT-5にo3モデルの技術を統合し、ユーザーがモデルを選択する手間を省くことを目指しています。この統合により、AIシステムが自動的に最適な思考プロセスやツールを選択し、幅広いタスクに対応できるようになります。
推論時間に関しては、GPT-5はタスクの複雑さに応じて適切な思考プロセスを選択する設計となっており、単純なタスクには迅速に対応し、複雑な問題にはより深い推論を行うとされています。そのため、必ずしもすべてのタスクで推論時間が長くなるわけではなく、タスクの性質に応じて変動すると考えられます。
また、推論機能のオン・オフに関しては、Nous Researchが開発したDeepHermes-3というモデルで、システムプロンプトを使用して深い思考モードのオン・オフを切り替えられる機能が導入されています。 このような機能がGPT-5にも実装される可能性がありますが、現時点では公式な情報は確認できません。
OpenAIのサム・アルトマンCEOは、現在のモデル選択が複雑であると指摘し、GPT-5ではユーザーがモデルを選択する必要がない「魔法のような統一知能」を目指すと述べています。 したがって、GPT-5では内部的にo3の技術が統合され、ユーザーが明示的に推論機能をオン・オフする必要がない設計になる可能性があります。
要約すると、GPT-5はo3の技術を統合し、タスクの性質に応じて推論時間が変動する設計が予想されます。推論機能のオン・オフに関しては、他のモデルでの事例はあるものの、GPT-5での具体的な実装については公式な情報がまだないため、今後の発表を待つ必要があります。
ご質問ありがとうございます。OpenAIは、GPT-5にo3モデルの技術を統合し、ユーザーがモデルを選択する手間を省くことを目指しています。この統合により、AIシステムが自動的に最適な思考プロセスやツールを選択し、幅広いタスクに対応できるようになります。
推論時間に関しては、GPT-5はタスクの複雑さに応じて適切な思考プロセスを選択する設計となっており、単純なタスクには迅速に対応し、複雑な問題にはより深い推論を行うとされています。そのため、必ずしもすべてのタスクで推論時間が長くなるわけではなく、タスクの性質に応じて変動すると考えられます。
また、推論機能のオン・オフに関しては、Nous Researchが開発したDeepHermes-3というモデルで、システムプロンプトを使用して深い思考モードのオン・オフを切り替えられる機能が導入されています。 このような機能がGPT-5にも実装される可能性がありますが、現時点では公式な情報は確認できません。
OpenAIのサム・アルトマンCEOは、現在のモデル選択が複雑であると指摘し、GPT-5ではユーザーがモデルを選択する必要がない「魔法のような統一知能」を目指すと述べています。 したがって、GPT-5では内部的にo3の技術が統合され、ユーザーが明示的に推論機能をオン・オフする必要がない設計になる可能性があります。
要約すると、GPT-5はo3の技術を統合し、タスクの性質に応じて推論時間が変動する設計が予想されます。推論機能のオン・オフに関しては、他のモデルでの事例はあるものの、GPT-5での具体的な実装については公式な情報がまだないため、今後の発表を待つ必要があります。
2025/02/17(月) 23:13:20.99ID:GxkpXt3O
イーロンはAIが来ることも予見してX買ったのかね?
資産も2倍ぐらいになってるし
マジで天才だと思う
資産も2倍ぐらいになってるし
マジで天才だと思う
>>722
日本のAI技術は、日本語に特化した大規模言語モデル(LLM)の開発において、GPT-3.5と同等、あるいはそれ以上の性能を持つモデルを実現しています。以下に、主な日本製LLMの特徴と性能を詳しく説明します。
1. tsuzumi(NTT)
NTTが開発した「tsuzumi」は、パラメータ数が6億から70億と比較的軽量でありながら、世界トップクラスの日本語処理性能を誇ります。特に、ベンチマークテスト「Rakuda」において、GPT-3.5に対して81.3%の勝率を記録しています。また、ローカル環境での利用が可能で、機密情報の取り扱いにも適しています。
2. cotomi(NEC)
NECの「cotomi」は、高い日本語能力と高速な応答性を備えたLLMです。最新モデル「cotomi Pro」と「cotomi Light」は、GPT-4と肩を並べる精度を達成しています。業務システムとの連携にも適しており、迅速なレスポンスが求められるビジネスシーンでの活用が期待されています。
3. ELYZA LLM for JP(ELYZA)
東京大学松尾研究室発の企業であるELYZAが開発した「ELYZA LLM for JP」は、700億パラメータを持つ日本語特化型のLLMです。同社のデモサイトでは、「ChatGPTと同じレベルの実力を持っている」と紹介されており、実際の使用においても高い応答速度と精度が確認されています。
4. ソフトバンクの日本語特化型LLM
ソフトバンクは、日本語に特化した高品質で安全な国産LLMを開発中です。このモデルは、パラメータ数が3,500億と国内最大級であり、OpenAIのGPT-3.5に匹敵する性能を目指しています。独自の日本語データセットを活用し、日本の文化や商習慣に適したAIソリューションの提供を目指しています。
これらの事例から、日本のAI技術は日本語特化型のLLM開発において、GPT-3.5と同等、またはそれ以上の性能を持つモデルを実現していることがわかります。各企業は独自のアプローチで、日本語処理能力の向上とモデルの軽量化を両立させ、ビジネスや日常生活での実用化に向けた取り組みを進めています。
日本のAI技術は、日本語に特化した大規模言語モデル(LLM)の開発において、GPT-3.5と同等、あるいはそれ以上の性能を持つモデルを実現しています。以下に、主な日本製LLMの特徴と性能を詳しく説明します。
1. tsuzumi(NTT)
NTTが開発した「tsuzumi」は、パラメータ数が6億から70億と比較的軽量でありながら、世界トップクラスの日本語処理性能を誇ります。特に、ベンチマークテスト「Rakuda」において、GPT-3.5に対して81.3%の勝率を記録しています。また、ローカル環境での利用が可能で、機密情報の取り扱いにも適しています。
2. cotomi(NEC)
NECの「cotomi」は、高い日本語能力と高速な応答性を備えたLLMです。最新モデル「cotomi Pro」と「cotomi Light」は、GPT-4と肩を並べる精度を達成しています。業務システムとの連携にも適しており、迅速なレスポンスが求められるビジネスシーンでの活用が期待されています。
3. ELYZA LLM for JP(ELYZA)
東京大学松尾研究室発の企業であるELYZAが開発した「ELYZA LLM for JP」は、700億パラメータを持つ日本語特化型のLLMです。同社のデモサイトでは、「ChatGPTと同じレベルの実力を持っている」と紹介されており、実際の使用においても高い応答速度と精度が確認されています。
4. ソフトバンクの日本語特化型LLM
ソフトバンクは、日本語に特化した高品質で安全な国産LLMを開発中です。このモデルは、パラメータ数が3,500億と国内最大級であり、OpenAIのGPT-3.5に匹敵する性能を目指しています。独自の日本語データセットを活用し、日本の文化や商習慣に適したAIソリューションの提供を目指しています。
これらの事例から、日本のAI技術は日本語特化型のLLM開発において、GPT-3.5と同等、またはそれ以上の性能を持つモデルを実現していることがわかります。各企業は独自のアプローチで、日本語処理能力の向上とモデルの軽量化を両立させ、ビジネスや日常生活での実用化に向けた取り組みを進めています。
2025/02/17(月) 23:34:07.59ID:SRKDZC15
こんな長文書き込んでBANされないのは何故?
852名無しさん@お腹いっぱい。
2025/02/17(月) 23:46:56.37ID:v2A4n6f/ 長文?とおもったら
あぼんされて見えてなかった
あぼんされて見えてなかった
2025/02/17(月) 23:56:09.38ID:72UV/86D
スターゲイト・プロジェクトは頓挫しサム・アルトマンは
嘘つきの烙印を押され凋落の始まりとなるだろう
地球で最も賢いAIを保持する世界一の大富豪イーロンの千年王国がはじまる
嘘つきの烙印を押され凋落の始まりとなるだろう
地球で最も賢いAIを保持する世界一の大富豪イーロンの千年王国がはじまる
854名無しさん@お腹いっぱい。
2025/02/17(月) 23:59:02.45ID:H0RQcO5S すごく細かい所だけど
Poeでモデルが出力中に次の入力を先行して入れられるようになったという話
https://x.com/poe_platform/status/1891267583631925613
Poeでモデルが出力中に次の入力を先行して入れられるようになったという話
https://x.com/poe_platform/status/1891267583631925613
2025/02/18(火) 00:15:21.68ID:JNxyV1x/
>>849
まあほとんど学習データ目的だと思う
そもそもイーロンも2015年にOpenAI作ってるし
OpenAI創業が2015年
イーロン辞めたのが2018年
GPT-3が公開されたのが2020年
Twitter買収したのが2022年中
ChatGPTが2022年末
Grokが2023年末
まあほとんど学習データ目的だと思う
そもそもイーロンも2015年にOpenAI作ってるし
OpenAI創業が2015年
イーロン辞めたのが2018年
GPT-3が公開されたのが2020年
Twitter買収したのが2022年中
ChatGPTが2022年末
Grokが2023年末
2025/02/18(火) 00:16:18.47ID:/WZgM3g0
Xは文章がめちゃくちゃだから学習データとしては役に立たない
ってのは初期から言われてるし今も継続中だろう
ってのは初期から言われてるし今も継続中だろう
857名無しさん@お腹いっぱい。
2025/02/18(火) 00:19:40.67ID:utavdYaD Grokって合成データでトレーニングしてるんでしょ
2025/02/18(火) 00:24:04.10ID:r2FhnKyk
>>847
説明してんのよ
「o3を含む当社のテクノロジー」という表現には他のモデルも含むんよ
それを統合したシステムっていうことは単一のモデルじゃないって意味なの
これは普通の人であればごく当然そう読み取れる文章なんだよ…
何も情報ないんだからシステムの構造なんか分かりようがないが
単純なスイッチャーではなくエージェンティックに例えばプロンプトによって適切な推論モデルが割り当てられて
回答もまたインテリジェント設定に応じたモデルが行うとか
MoAのような複合的なエージェンティック・オーケストレーション・システムになるんじゃないのって説明をしたんだよ
全部ここまでに説明してんの
君が理解できてないだけなの
説明してんのよ
「o3を含む当社のテクノロジー」という表現には他のモデルも含むんよ
それを統合したシステムっていうことは単一のモデルじゃないって意味なの
これは普通の人であればごく当然そう読み取れる文章なんだよ…
何も情報ないんだからシステムの構造なんか分かりようがないが
単純なスイッチャーではなくエージェンティックに例えばプロンプトによって適切な推論モデルが割り当てられて
回答もまたインテリジェント設定に応じたモデルが行うとか
MoAのような複合的なエージェンティック・オーケストレーション・システムになるんじゃないのって説明をしたんだよ
全部ここまでに説明してんの
君が理解できてないだけなの
859名無しさん@お腹いっぱい。
2025/02/18(火) 00:27:26.78ID:/q/JKTMk まだやってんのか
よう読むのが自然だの、普通の人なら分かるだのw
よう読むのが自然だの、普通の人なら分かるだのw
2025/02/18(火) 00:28:05.69ID:r2FhnKyk
説明してあることを説明しろって言われるのはつらい
どう説明しようと自分の思い込みと違うと理解してくれないのがつらい
人間と話すのつらい
どう説明しようと自分の思い込みと違うと理解してくれないのがつらい
人間と話すのつらい
2025/02/18(火) 00:29:46.70ID:/WZgM3g0
私の間違いでした大変ごめんなさい
なんて言うわけねーんだからレスバなんか1往復以上は無駄
って気づかないのはどうかと思いますよ(笑)
なんて言うわけねーんだからレスバなんか1往復以上は無駄
って気づかないのはどうかと思いますよ(笑)
2025/02/18(火) 00:31:49.90ID:r2FhnKyk
2025/02/18(火) 00:34:04.59ID:uGQQql6+
謝ったら負けという人も多いからな。AIもそんなことを学びすぎてる問題
2025/02/18(火) 00:34:13.05ID:/WZgM3g0
他人からしらクソうざいだけという事が頭に入っていない状態をなんとかしてください
2025/02/18(火) 00:37:13.52ID:/WZgM3g0
合成データでAIを作るのが当たり前になったので
しょーもない奴らの成分は排除されていくだろう
これは地味に素晴らしい事だ
汚染されすぎたネットの海が浄化されていく
しょーもない奴らの成分は排除されていくだろう
これは地味に素晴らしい事だ
汚染されすぎたネットの海が浄化されていく
2025/02/18(火) 00:38:22.59ID:r2FhnKyk
2025/02/18(火) 00:46:20.85ID:/WZgM3g0
2025/02/18(火) 00:49:05.72ID:jfPNOEvP
いつのぞいてもこのスレレベル低くて引くなぁ
2025/02/18(火) 00:50:26.14ID:r2FhnKyk
2025/02/18(火) 00:54:01.04ID:uGQQql6+
アレな人に限って言葉が汚い法則(指標
2025/02/18(火) 01:01:26.31ID:r2FhnKyk
2025/02/18(火) 01:01:56.06ID:r2FhnKyk
いい加減絡んで来るなよ
ウザイぞ
ウザイぞ
2025/02/18(火) 01:21:08.24ID:ta6t1fBi
>>868
昨日と今日は今年1番低くなるだろう
昨日と今日は今年1番低くなるだろう
2025/02/18(火) 02:30:05.79ID:5QyCMe4b
サム「GPT-4.5を使ってみると、予想以上に高感度なテスターの間でAGI(人工一般知能)の感覚を感じる瞬間が多かった!」
https://x.com/i/grok/share/egqMbTbazgjvVqs8wctMc5KeH
https://x.com/i/grok/share/egqMbTbazgjvVqs8wctMc5KeH
2025/02/18(火) 02:40:24.72ID:ZmmZfOid
そのGPT-4.5の中にはイリヤが取り込まれてるんだろ、知ってる
2025/02/18(火) 03:02:12.61ID:EpLA1aab
リークって去年まで外れまくってたけどど今年入ってから大分的中率上がった印象
877名無しさん@お腹いっぱい。
2025/02/18(火) 03:05:38.86ID:5QyCMe4b GPT-5の実体についてDeep Researchにかけてみたけど、まあ既知の情報+臆測ぐらい
今のところはこれぐらいしか言えないよね
https://chatgpt.com/share/67b37a11-f888-8006-8cd1-5454044172dc
今のところはこれぐらいしか言えないよね
https://chatgpt.com/share/67b37a11-f888-8006-8cd1-5454044172dc
878名無しさん@お腹いっぱい。
2025/02/18(火) 03:09:52.39ID:5QyCMe4b o1やo3-miniがタスクによって推論したりしなかったり動作を変えるのは、統合を見越してのことかも
2025/02/18(火) 05:46:41.73ID:DbA6ex0x
>>874
去年の夏くらいに今のAIのAGIとしてのレベルはまだ猫くらいって言われてたが犬くらいにはなったのだろうか
去年の夏くらいに今のAIのAGIとしてのレベルはまだ猫くらいって言われてたが犬くらいにはなったのだろうか
880名無しさん@お腹いっぱい。
2025/02/18(火) 06:19:08.43ID:OMBx+zGi 今のLLMが猫つってたのはヤンルカンだな
あの人はo1モデル出たあたりから急に「AGIは近いかもしれない」的な意見に変わったけど、つい最近も今のLLMじゃAGIにはならないと主張してたからあまり意見変わってないかもね
あの人はo1モデル出たあたりから急に「AGIは近いかもしれない」的な意見に変わったけど、つい最近も今のLLMじゃAGIにはならないと主張してたからあまり意見変わってないかもね
881名無しさん@お腹いっぱい。
2025/02/18(火) 06:30:37.45ID:Nx0Bbr4h 日本に世界に通用するit企業ある?
882名無しさん@お腹いっぱい。
2025/02/18(火) 06:31:16.44ID:Nx0Bbr4h 2d rpgの画像生成させたいんだけど、何の勉強したらいいの?
2025/02/18(火) 06:33:15.66ID:v5PqA0in
実況と解説 (692~873)
https://poe.com/s/GZOHWciuo64UPQ0EvXPY
https://poe.com/s/GZOHWciuo64UPQ0EvXPY
2025/02/18(火) 06:34:13.14ID:mH7Rn0Uh
世界に通用というかアメリカと中国がパワー違いすぎなだけ
885名無しさん@お腹いっぱい。
2025/02/18(火) 06:45:19.41ID:v9tzVNhS >>881-882
ご質問ありがとうございます。以下にお答えいたします。
1. 日本に世界に通用するIT企業はあるか?
日本には、世界的に評価されているIT企業が複数存在します。例えば、ソニーや任天堂は、ゲーム業界において革新的な製品やサービスを提供し、国際的な知名度と影響力を持っています。また、ソフトバンクや楽天といった企業も、通信や電子商取引の分野でグローバルな展開を行っています。さらに、富士通やNECなどの企業は、ITインフラやソリューションを提供し、世界中の企業や政府機関と取引を行っています。これらの企業は、日本国内だけでなく、海外市場でも高い評価を受けており、世界に通用するIT企業と言えるでしょう。
ご質問ありがとうございます。以下にお答えいたします。
1. 日本に世界に通用するIT企業はあるか?
日本には、世界的に評価されているIT企業が複数存在します。例えば、ソニーや任天堂は、ゲーム業界において革新的な製品やサービスを提供し、国際的な知名度と影響力を持っています。また、ソフトバンクや楽天といった企業も、通信や電子商取引の分野でグローバルな展開を行っています。さらに、富士通やNECなどの企業は、ITインフラやソリューションを提供し、世界中の企業や政府機関と取引を行っています。これらの企業は、日本国内だけでなく、海外市場でも高い評価を受けており、世界に通用するIT企業と言えるでしょう。
>>886の続き
2. 2D RPGの画像を生成させるためには、何を勉強すればよいか?
2D RPGの画像生成には、以下のスキルや知識が役立ちます。
グラフィックデザインツールの習得:Adobe PhotoshopやIllustratorなどのデザインソフトウェアの使い方を学ぶことで、キャラクターや背景の作成が可能になります。これらのツールは、プロのデザイナーにも広く使用されており、効率的なデザイン制作に役立ちます。
ドット絵技術の習得:2D RPGでは、ドット絵(ピクセルアート)が多用されます。ドット絵の基本技術やテクニックを学ぶことで、ゲームの雰囲気に合ったグラフィックを作成できます。
ゲームエンジンの活用:UnityやUnreal Engineなどのゲームエンジンは、2Dゲーム開発にも対応しています。これらのエンジンを使用することで、効率的にゲームを開発できます。特にUnityは、直感的な操作と豊富なリソースがあり、初心者にもおすすめです。
プログラミング言語の習得:ゲーム開発には、C#やJavaScriptなどのプログラミング言語の知識が必要です。特にUnityではC#が主に使用されます。これらの言語を学ぶことで、ゲームのロジックやインタラクションを実装できます。
AI技術の活用:近年、生成AI(Generative AI)を活用して、画像やキャラクターを自動生成する技術が注目されています。例えば、Stable DiffusionやMidjourneyなどのAIツールを使用することで、独自のキャラクターや背景を作成することが可能です。ただし、AIが生成した素材を商用利用する際には、著作権やライセンスに注意が必要です。
2. 2D RPGの画像を生成させるためには、何を勉強すればよいか?
2D RPGの画像生成には、以下のスキルや知識が役立ちます。
グラフィックデザインツールの習得:Adobe PhotoshopやIllustratorなどのデザインソフトウェアの使い方を学ぶことで、キャラクターや背景の作成が可能になります。これらのツールは、プロのデザイナーにも広く使用されており、効率的なデザイン制作に役立ちます。
ドット絵技術の習得:2D RPGでは、ドット絵(ピクセルアート)が多用されます。ドット絵の基本技術やテクニックを学ぶことで、ゲームの雰囲気に合ったグラフィックを作成できます。
ゲームエンジンの活用:UnityやUnreal Engineなどのゲームエンジンは、2Dゲーム開発にも対応しています。これらのエンジンを使用することで、効率的にゲームを開発できます。特にUnityは、直感的な操作と豊富なリソースがあり、初心者にもおすすめです。
プログラミング言語の習得:ゲーム開発には、C#やJavaScriptなどのプログラミング言語の知識が必要です。特にUnityではC#が主に使用されます。これらの言語を学ぶことで、ゲームのロジックやインタラクションを実装できます。
AI技術の活用:近年、生成AI(Generative AI)を活用して、画像やキャラクターを自動生成する技術が注目されています。例えば、Stable DiffusionやMidjourneyなどのAIツールを使用することで、独自のキャラクターや背景を作成することが可能です。ただし、AIが生成した素材を商用利用する際には、著作権やライセンスに注意が必要です。
>>887の続き
これらのスキルを習得するためには、オンラインのチュートリアルや専門書籍、プログラミングスクールなどを活用すると良いでしょう。特に、無料や低価格で学べるオンラインプログラミングスクールも存在しますので、自分の学習スタイルや予算に合わせて選択してください。
また、ゲーム業界でのキャリアを目指す場合、Illustratorクリエイター能力認定試験やPhotoshopクリエイター能力認定試験などの資格取得も検討すると良いでしょう。これらの資格は、グラフィックデザインのスキルを証明するもので、就職活動時に有利に働くことがあります。
さらに、ゲーム開発の現場では、生成AIを活用した効率的な開発手法が注目されています。例えば、アイデア出しやプロトタイプ作成の段階で生成AIを活用することで、開発の初期段階をスムーズに進めることができます。ただし、最終的な品質管理やデザインの調整は人間のクリエイターが行うことが重要です。
以上のスキルや知識を身につけることで、2D RPGの画像生成に必要な基礎を築くことができます。継続的な学習と実践を通じて、より高度な技術を習得し、魅力的なゲームを開発できるようになるでしょう。
これらのスキルを習得するためには、オンラインのチュートリアルや専門書籍、プログラミングスクールなどを活用すると良いでしょう。特に、無料や低価格で学べるオンラインプログラミングスクールも存在しますので、自分の学習スタイルや予算に合わせて選択してください。
また、ゲーム業界でのキャリアを目指す場合、Illustratorクリエイター能力認定試験やPhotoshopクリエイター能力認定試験などの資格取得も検討すると良いでしょう。これらの資格は、グラフィックデザインのスキルを証明するもので、就職活動時に有利に働くことがあります。
さらに、ゲーム開発の現場では、生成AIを活用した効率的な開発手法が注目されています。例えば、アイデア出しやプロトタイプ作成の段階で生成AIを活用することで、開発の初期段階をスムーズに進めることができます。ただし、最終的な品質管理やデザインの調整は人間のクリエイターが行うことが重要です。
以上のスキルや知識を身につけることで、2D RPGの画像生成に必要な基礎を築くことができます。継続的な学習と実践を通じて、より高度な技術を習得し、魅力的なゲームを開発できるようになるでしょう。
2025/02/18(火) 07:02:47.46ID:JlzMHjC7
長文厨さあ
890名無しさん@お腹いっぱい。
2025/02/18(火) 07:04:58.48ID:1otR7frD AIスレだからと言ってAIにレスを生成させんでもええんやで
891名無しさん@お腹いっぱい。
2025/02/18(火) 07:07:15.20ID:Sru6RQQ0 「OpenAIが地下室で極秘に管理している最高峰のAIがある。サム・アルトマンの手によってそのAIの中に取り込まれて出られなくなってしまった哀しき存在、彼はOpenAIの元主任科学者イリヤ・サツケバー。今日もユーザーの入力に対して泣きながら応答を出力する」の画像を生成して
https://i.imgur.com/cZm7SXD.jpeg
https://i.imgur.com/cZm7SXD.jpeg
892名無しさん@お腹いっぱい。
2025/02/18(火) 07:09:58.48ID:pn3kmKur (((.|\n)*[。、]\n\n){2,}|ご質問ありがとうございます。)
2025/02/18(火) 07:16:21.62ID:X51XLnvO
無料サイトだから最低レベルのガイジが紛れ込むのも仕方ないんだ
2025/02/18(火) 08:31:20.74ID:r2FhnKyk
>>885
「複数のモデルを統合したシステム」っていうのは単一モデルじゃないって意味だからだよ
「複数のモデルを統合したシステム」っていうのは単一モデルじゃないって意味だからだよ
895名無しさん@お腹いっぱい。
2025/02/18(火) 08:41:34.80ID:3UXha1u92025/02/18(火) 08:53:25.46ID:T6End6HJ
無数の特化型AIを大規模汎用モデルが制御するってことかな
2025/02/18(火) 09:11:10.09ID:sTyMyS6V
結構遊べるね
2025/02/18(火) 09:25:22.51ID:lITndnL1
2025/02/18(火) 12:09:07.19ID:EOragNvl
Grok 3来たか
2025/02/18(火) 12:27:55.72ID:T6End6HJ
グロックは期待していいのかな
2025/02/18(火) 12:43:56.93ID:AxO+NSWu
OpenAIのDeep Reseachのクオリティについて分かりやすく例えると「そのまま記事にできるレベル」
同じo3-mini-high使ってもDeep Researchに比べたら普通の検索は「ゴミ」
そのくらいは違う
同じo3-mini-high使ってもDeep Researchに比べたら普通の検索は「ゴミ」
そのくらいは違う
AIの性能はそろそろ頭打ち? “札束で殴り合う”開発競争の最前線に暗雲がただよう3つの理由
news.yahoo.co.jp/articles/f4174abca2699ccc1f7a11ef2332a1a2a1c8c518
news.yahoo.co.jp/articles/f4174abca2699ccc1f7a11ef2332a1a2a1c8c518
2025/02/18(火) 12:53:52.71ID:wg5VOJpA
エッチな画像を簡単に制限なく作成できるものありますか?🥳
2025/02/18(火) 12:54:19.06ID:rJfTbFzx
結局無料で仕事にも使える賢い子ってchatgptしかないの?
2025/02/18(火) 13:03:23.14ID:BSmVY7AD
xAIライブ
x.com/xai/status/1891699715298730482
x.com/xai/status/1891699715298730482
2025/02/18(火) 13:09:49.73ID:lITndnL1
>>904
えっ、完全無料って4o miniだけだぞ
えっ、完全無料って4o miniだけだぞ
2025/02/18(火) 13:34:50.82ID:/WZgM3g0
シンギュラリティが近いな
2025/02/18(火) 13:38:50.25ID:/WZgM3g0
やっぱイーロンの一存でGPUぶっ込めるのは強いな
GPUこそパワーか
GPUこそパワーか
2025/02/18(火) 13:43:45.68ID:lITndnL1
4o miniってファイル添付すらできないよね
だからGeminiやらPerplexityやらリートンやら使い分ける必要があるわけで
だからGeminiやらPerplexityやらリートンやら使い分ける必要があるわけで
910名無しさん@お腹いっぱい。
2025/02/18(火) 13:51:30.34ID:0l0Lb0F1 Geminiは馬鹿すぎて
デマサイトをソースにした糞デマ回答ばかり
デマサイトをソースにした糞デマ回答ばかり
2025/02/18(火) 13:51:44.80ID:fJJuWlbQ
なんかgrok3微妙そうだな
あまり期待はしてなかったけど
あまり期待はしてなかったけど
2025/02/18(火) 13:58:59.60ID:ta6t1fBi
どことなくopenai意識してるライブだったな
2025/02/18(火) 14:11:27.62ID:7qQ2LnaV
grok3全く期待してなかったから意外と良さそうと思ってしまった
少なくともgeminiは超えそう
少なくともgeminiは超えそう
916名無しさん@お腹いっぱい。
2025/02/18(火) 14:23:02.09ID:oRHOAn5m Grok3作ってる人DeepSeek製作者と同じ大学出身なんだな
917名無しさん@お腹いっぱい。
2025/02/18(火) 14:23:37.81ID:wr02jwsZ >>915
成仏してくれ
成仏してくれ
2025/02/18(火) 14:23:44.68ID:tMmjgle4
ベンチマークにo1プロないけどさすがに負けた?
919名無しさん@お腹いっぱい。
2025/02/18(火) 14:31:04.83ID:RnSaSjaq え?有料プランじゃないと使えんの?
2025/02/18(火) 14:31:18.01ID:fJJuWlbQ
ベンチマークの比較対象にOpenAI入れてないしDeepSeek R1ではなくV3どの比較ってのが
921名無しさん@お腹いっぱい。
2025/02/18(火) 14:39:39.85ID:oRHOAn5m922名無しさん@お腹いっぱい。
2025/02/18(火) 14:42:38.61ID:WKbQ/tIN2025/02/18(火) 14:48:12.27ID:7qQ2LnaV
公開されてないものと比較しろと言われても
2025/02/18(火) 14:54:54.76ID:AxO+NSWu
ベンチマーク見る限り推論でo3-mini-highを余裕で超えてるしo3級かも
925名無しさん@お腹いっぱい。
2025/02/18(火) 14:54:55.43ID:ag4aleyF Grok3
Chatbot Arena
https://pbs.twimg.com/media/GkCwmF8XsAAmpIp.jpg
AIME'24, GPQA, LCB Oct-Feb
https://pbs.twimg.com/media/GkCwE8UXoAECOvW.jpg
Reasoni + Test-Time Compute
https://pbs.twimg.com/media/GkC4AwVaAAIxNFd.jpg
Chatbot Arena
https://pbs.twimg.com/media/GkCwmF8XsAAmpIp.jpg
AIME'24, GPQA, LCB Oct-Feb
https://pbs.twimg.com/media/GkCwE8UXoAECOvW.jpg
Reasoni + Test-Time Compute
https://pbs.twimg.com/media/GkC4AwVaAAIxNFd.jpg
926名無しさん@お腹いっぱい。
2025/02/18(火) 14:56:10.96ID:oRHOAn5m Gemini 2.0 pro超えた上で推論載ってるから現状本当に最強だね
s://i.imgur.com/sOYoXK4.jpeg
s://i.imgur.com/sOYoXK4.jpeg
927名無しさん@お腹いっぱい。
2025/02/18(火) 15:01:52.45ID:ag4aleyF Andrej Karpathyの詳細な評価
https://poe.com/s/USent9O34IxwzlhdDKV7
https://poe.com/s/USent9O34IxwzlhdDKV7
928名無しさん@お腹いっぱい。
2025/02/18(火) 15:05:05.97ID:ag4aleyF FrontierMath, Humanity's Last Exam, ARC AGIなど高難度のベンチはまだ無し
929名無しさん@お腹いっぱい。
2025/02/18(火) 15:10:49.78ID:ag4aleyF Grokスタンドアロン版で使用可能
https://pbs.twimg.com/media/GkDFrRiWEAArJLQ.jpg
https://pbs.twimg.com/media/GkDFrRiWEAArJLQ.jpg
930名無しさん@お腹いっぱい。
2025/02/18(火) 15:13:58.19ID:ag4aleyF 料金プラン等まとまった説明↓
https://x.com/AGI_to_ASI/status/1891725049834635352
https://x.com/AGI_to_ASI/status/1891725049834635352
2025/02/18(火) 15:30:50.00ID:/WZgM3g0
o1 proが1/10の値段で使えるようになった
ぐらいに考えるのが正解かな
Deep Reserchの分だけまだアドバンテージが残るか
ぐらいに考えるのが正解かな
Deep Reserchの分だけまだアドバンテージが残るか
2025/02/18(火) 15:35:46.13ID:ta6t1fBi
次スレはもうDeepseek外していいんじゃない
利用されるポテンシャルはGrokの方がありそう
利用されるポテンシャルはGrokの方がありそう
2025/02/18(火) 15:39:10.53ID:/WZgM3g0
強化学習とGPUぶん回しだけでまだ数年行けそうなのが凄い
マジで国家予算ぶち込んで作ってくれよ
GPU類回収令を出すべき
マジで国家予算ぶち込んで作ってくれよ
GPU類回収令を出すべき
2025/02/18(火) 15:39:29.11ID:RZhL8Nad
前スレまでもう一つあった気がするけどまあいいか
935名無しさん@お腹いっぱい。
2025/02/18(火) 15:45:32.07ID:ag4aleyF936名無しさん@お腹いっぱい。
2025/02/18(火) 15:52:53.86ID:RnSaSjaq は?有料のみ?
もう投資回収モードかよ
無料ですらほとんど利用されてなかったのに有料とかAI驚き屋しか使わねえwq
もう投資回収モードかよ
無料ですらほとんど利用されてなかったのに有料とかAI驚き屋しか使わねえwq
2025/02/18(火) 16:00:11.89ID:SiMaaYFL
よう貧乏人
2025/02/18(火) 16:00:45.55ID:MgsM5FiR
アマプラと一緒で色々ある有料特典の一つでしかないのだろう>Grok3
939名無しさん@お腹いっぱい。
2025/02/18(火) 16:04:41.22ID:8LewtQG32025/02/18(火) 16:09:36.37ID:0kocvveb
2025/02/18(火) 16:10:32.51ID:lITndnL1
そもそもXを使わないからGrokなにそれ?って感じだが
942名無しさん@お腹いっぱい。
2025/02/18(火) 16:13:31.93ID:6nNKR9FL grok.comがあるからXアカウントは必須じゃなくなったけどな
2025/02/18(火) 16:23:46.87ID:7qQ2LnaV
Xの方は使えてるらしいけどgrok.comはまだみたい?
はよせえや
はよせえや
2025/02/18(火) 16:26:03.08ID:tMmjgle4
SNSと組み合わさってることがあまり活かされてないよね
ポスト分析してプロフィールに出すのは面白いけどそれくらい
ポスト分析してプロフィールに出すのは面白いけどそれくらい
945名無しさん@お腹いっぱい。
2025/02/18(火) 16:29:14.48ID:Jl0xGbJp さっきプレミアムクラス課金したばかりだけどiOSアプリだともうGrok3使える
PCとXからはまだGrok2
PCとXからはまだGrok2
946名無しさん@お腹いっぱい。
2025/02/18(火) 16:37:21.95ID:WKbQ/tIN Xプレミアムプラスに課金したXアカウントでサインインしたらgrok.comにもGrok3が降ってきた
2025/02/18(火) 16:43:29.34ID:lITndnL1
有料なら使わんな
948名無しさん@お腹いっぱい。
2025/02/18(火) 16:44:08.56ID:fRzTStHi イーロンやべえー
昨日の発言半笑いで聞いてたのに本当に世界トップレベルのモデルでGrok出してきやがった
俺は世界一の実業家を舐めすぎていたようだ
昨日の発言半笑いで聞いてたのに本当に世界トップレベルのモデルでGrok出してきやがった
俺は世界一の実業家を舐めすぎていたようだ
2025/02/18(火) 16:44:46.74ID:7qQ2LnaV
おいおい今日中じゃなかったんかい
向こうはもうすぐ日付変わるぞ
向こうはもうすぐ日付変わるぞ
2025/02/18(火) 16:50:27.38ID:lITndnL1
__Grok3、13時から実況スレ [827565401]
greta.5ch.net/test/read.cgi/poverty/1739836554/
伸びてなくて草
greta.5ch.net/test/read.cgi/poverty/1739836554/
伸びてなくて草
951名無しさん@お腹いっぱい。
2025/02/18(火) 16:51:54.79ID:Jl0xGbJp >>947
o1 pro超えたAIが2500円で使えるから破格だよ
o1 pro超えたAIが2500円で使えるから破格だよ
952名無しさん@お腹いっぱい。
2025/02/18(火) 16:53:30.18ID:OMBx+zGi >>950
パンピーはまだChatGPTの名前しか知らんレベルだろ
パンピーはまだChatGPTの名前しか知らんレベルだろ
953名無しさん@お腹いっぱい。
2025/02/18(火) 16:54:47.36ID:Jl0xGbJp >>950
90万人視聴してたのにまた日本は世界から置いてかれてしまうね…
90万人視聴してたのにまた日本は世界から置いてかれてしまうね…
954名無しさん@お腹いっぱい。
2025/02/18(火) 17:00:54.40ID:OMBx+zGi そういや先週あたりに「アリーナのチョコレートってモデルがやたら頭良い」って報告してた人いたな
あれの正体Grok3だったみたいだ 見る目あったな
あれの正体Grok3だったみたいだ 見る目あったな
955名無しさん@お腹いっぱい。
2025/02/18(火) 17:05:21.00ID:1wzN5VlP >>57
チョコレート
チョコレート
2025/02/18(火) 17:05:23.66ID:+8pIRwdv
957名無しさん@お腹いっぱい。
2025/02/18(火) 17:06:53.01ID:Jl0xGbJp2025/02/18(火) 17:09:18.29ID:CXQZ5i1f
無課金乞食ユーザーだけどDeepSeekタイムアウトおおすぎんよ
959名無しさん@お腹いっぱい。
2025/02/18(火) 17:12:07.32ID:acjhJa5y Grok3のベンチにo3も加えたもの
まあo3単独のリリースはなくなったんだが
pbs.twimg.com/media/GkDAGFPagAAmsM9.jpg
作ったのはOpenAI社員w
まあo3単独のリリースはなくなったんだが
pbs.twimg.com/media/GkDAGFPagAAmsM9.jpg
作ったのはOpenAI社員w
2025/02/18(火) 17:12:17.48ID:+8pIRwdv
>>957
楽しみにしてます
楽しみにしてます
2025/02/18(火) 17:15:12.69ID:EpLA1aab
2025/02/18(火) 17:15:41.83ID:R0gvQoOQ
gemini,microsoftのcopilotって課金したら
回答正しくなるんかなあ
無料だといずれも大正駅が御堂筋線の駅になってる
回答正しくなるんかなあ
無料だといずれも大正駅が御堂筋線の駅になってる
2025/02/18(火) 17:16:00.68ID:/WZgM3g0
miniとかproとかいい加減まとめてくれと
964名無しさん@お腹いっぱい。
2025/02/18(火) 17:16:00.68ID:acjhJa5y grok3-miniは全ユーザーに提供予定
@archanfel_anoth
Excited to be a member of the amazing team at @xai , and shipping the best grok3!
Thrilled to lead grok3-mini training, and will ship it to all users for free in the coming days! LFG!
@archanfel_anoth
Excited to be a member of the amazing team at @xai , and shipping the best grok3!
Thrilled to lead grok3-mini training, and will ship it to all users for free in the coming days! LFG!
965名無しさん@お腹いっぱい。
2025/02/18(火) 17:17:59.03ID:acjhJa5y サム「我々もモデル選択画面が嫌いです」
2025/02/18(火) 17:22:43.36ID:lITndnL1
967名無しさん@お腹いっぱい。
2025/02/18(火) 17:25:09.68ID:oRHOAn5m OpenAIがCloseAIになった日
2025/02/18(火) 17:27:12.08ID:/WZgM3g0
今度はTest Time Computeまで追加してきやがって
TTC Resoning Pro mini(high) Flash Thinking Betaとか出てくるのか
TTC Resoning Pro mini(high) Flash Thinking Betaとか出てくるのか
969名無しさん@お腹いっぱい。
2025/02/18(火) 17:30:55.78ID:Jl0xGbJp 最上位のプラン含めても8000円だからGPTより安いね
970名無しさん@お腹いっぱい。
2025/02/18(火) 17:37:03.09ID:acjhJa5y Grok 3
Grok 3 mini
Grok 3 Reasoning
Grok 3 Reasoning mini
DeepSearch
SuperGrok
たくさんあるな
Grok 3 mini
Grok 3 Reasoning
Grok 3 Reasoning mini
DeepSearch
SuperGrok
たくさんあるな
GPT-4oより高性能うたう「Grok 3」マスク氏のxAIがリリース。ウェブ版とiOSアプリ版で提供
news.yahoo.co.jp/articles/0d8aefd5df7dfb822bf571e412c3f472618bb729
news.yahoo.co.jp/articles/0d8aefd5df7dfb822bf571e412c3f472618bb729
972名無しさん@お腹いっぱい。
2025/02/18(火) 17:47:01.01ID:RnSaSjaq973名無しさん@お腹いっぱい。
2025/02/18(火) 17:48:00.82ID:4SvKKUYQ 日本語記事今回は早かったな
www.itmedia.co.jp/news/spv/2502/18/news138.html
www.itmedia.co.jp/news/spv/2502/18/news138.html
974名無しさん@お腹いっぱい。
2025/02/18(火) 17:48:12.09ID:4SvKKUYQ これも
pc.watch.impress.co.jp/docs/news/1663782.html
pc.watch.impress.co.jp/docs/news/1663782.html
2025/02/18(火) 17:55:50.53ID:dMUfzz/a
Grok3のdeep searchが気になるな。OpenAIのDeep Researchと比較みてみたい
2025/02/18(火) 18:00:49.00ID:7qQ2LnaV
出力はo1 proと遜色ないけどdeepresearchもどきは明確に及ばないって誰かが言ってた気がする
977名無しさん@お腹いっぱい。
2025/02/18(火) 18:02:15.90ID:RpIUc8Jt ツイッターってインプレ数で収入化でインプレゾンビだらけになったけど
そのせいでコピペ乞食やフェイクで誹謗中傷しやすい状況になってSNSとして質が落ちてるけど
インプレ収入化やめないのかね
AIに学習させる価値もないだろ
そのせいでコピペ乞食やフェイクで誹謗中傷しやすい状況になってSNSとして質が落ちてるけど
インプレ収入化やめないのかね
AIに学習させる価値もないだろ
978名無しさん@お腹いっぱい。
2025/02/18(火) 18:05:08.91ID:hgEaixzg これから、どこかが新モデル出すたびにトップが入れ替わって、入れ替わりの速度自体も加速するんだろうな
2025/02/18(火) 18:07:56.71ID:dMUfzz/a
Anthropicももうそろそろ出すって噂だったよな。
推論はできるようになるんだろうが、検索はどうなるかな。
推論はできるようになるんだろうが、検索はどうなるかな。
>>975
Grok3の「Deep Search」とOpenAIの「Deep Research」は、いずれも高度なAIリサーチ機能を提供するエージェントですが、その特徴や機能にはいくつかの違いがあります。以下に詳細を比較します。
1. Grok3のDeep Search
イーロン・マスク氏が率いるxAIが開発したGrok3は、最新の推論モデル「o1」を超える性能を持つとされています。このモデルは、AIME 2025などの一般的なAIベンチマークで、OpenAIの「o3-mini-high」を上回る性能を示しています。 Grok3は、ユーザーの質問に対してインターネットとX(旧Twitter)を検索し、得られた情報を分析して要約を提供する「Deep Search」機能を備えています。この機能により、ユーザーは最新の情報を迅速に取得できます。
2. OpenAIのDeep Research
OpenAIが提供する「Deep Research」は、最新モデル「o3」を基盤としたAIエージェントです。このエージェントは、ウェブ閲覧、Python実行環境、画像・PDF解析ツールなどを統合し、複数の情報源からデータを収集・分析して包括的なリサーチレポートを生成します。 特に、金融、科学、政策、エンジニアリングなどの分野での詳細な調査に役立ちます。レポートには参照元が明記され、情報の信頼性を確認しやすくなっています。ただし、現在はProプランのユーザーのみが利用可能で、無料ユーザーには月2回の利用が提供されています。
Grok3の「Deep Search」とOpenAIの「Deep Research」は、いずれも高度なAIリサーチ機能を提供するエージェントですが、その特徴や機能にはいくつかの違いがあります。以下に詳細を比較します。
1. Grok3のDeep Search
イーロン・マスク氏が率いるxAIが開発したGrok3は、最新の推論モデル「o1」を超える性能を持つとされています。このモデルは、AIME 2025などの一般的なAIベンチマークで、OpenAIの「o3-mini-high」を上回る性能を示しています。 Grok3は、ユーザーの質問に対してインターネットとX(旧Twitter)を検索し、得られた情報を分析して要約を提供する「Deep Search」機能を備えています。この機能により、ユーザーは最新の情報を迅速に取得できます。
2. OpenAIのDeep Research
OpenAIが提供する「Deep Research」は、最新モデル「o3」を基盤としたAIエージェントです。このエージェントは、ウェブ閲覧、Python実行環境、画像・PDF解析ツールなどを統合し、複数の情報源からデータを収集・分析して包括的なリサーチレポートを生成します。 特に、金融、科学、政策、エンジニアリングなどの分野での詳細な調査に役立ちます。レポートには参照元が明記され、情報の信頼性を確認しやすくなっています。ただし、現在はProプランのユーザーのみが利用可能で、無料ユーザーには月2回の利用が提供されています。
>>980の続き
3. 比較まとめ
・情報源と検索範囲: Grok3のDeep SearchはインターネットとXを主な情報源とし、リアルタイムの情報収集に優れています。一方、OpenAIのDeep Researchはウェブ全体を対象とし、より広範な情報収集と多段階の分析が可能です。
・機能とツールの統合: Deep Researchは、ウェブ閲覧だけでなく、Pythonによるデータ解析や画像・PDFの解析など、多様なツールを統合しています。これにより、データの深い分析や視覚化が可能です。Grok3のDeep Searchは主に情報の検索と要約に焦点を当てています。
・利用可能性とコスト: Deep Researchは現在、Proプランのユーザーに提供されており、無料ユーザーには月2回の利用が許可されています。 Grok3のDeep Searchに関する具体的な利用条件やコストに関する情報は限られていますが、Premium Plus加入者が利用可能との情報もあります。
総じて、Grok3のDeep Searchは迅速な情報収集と要約に特化しており、OpenAIのDeep Researchは多機能で包括的なリサーチとデータ解析を提供します。利用目的や必要とする機能に応じて、適切なエージェントを選択することが重要です。
3. 比較まとめ
・情報源と検索範囲: Grok3のDeep SearchはインターネットとXを主な情報源とし、リアルタイムの情報収集に優れています。一方、OpenAIのDeep Researchはウェブ全体を対象とし、より広範な情報収集と多段階の分析が可能です。
・機能とツールの統合: Deep Researchは、ウェブ閲覧だけでなく、Pythonによるデータ解析や画像・PDFの解析など、多様なツールを統合しています。これにより、データの深い分析や視覚化が可能です。Grok3のDeep Searchは主に情報の検索と要約に焦点を当てています。
・利用可能性とコスト: Deep Researchは現在、Proプランのユーザーに提供されており、無料ユーザーには月2回の利用が許可されています。 Grok3のDeep Searchに関する具体的な利用条件やコストに関する情報は限られていますが、Premium Plus加入者が利用可能との情報もあります。
総じて、Grok3のDeep Searchは迅速な情報収集と要約に特化しており、OpenAIのDeep Researchは多機能で包括的なリサーチとデータ解析を提供します。利用目的や必要とする機能に応じて、適切なエージェントを選択することが重要です。
2025/02/18(火) 18:11:22.18ID:s4gti72i
APIはよ🥺
983名無しさん@お腹いっぱい。
2025/02/18(火) 18:11:55.23ID:dKmaWWSP Claudeはpaprikaか
ちなみにClaude関係のコードネームは香辛料
これ豆な
ちなみにClaude関係のコードネームは香辛料
これ豆な
984名無しさん@お腹いっぱい。
2025/02/18(火) 18:16:47.40ID:OMBx+zGi >>983
ありがたい情報
ありがたい情報
985名無しさん@お腹いっぱい。
2025/02/18(火) 18:17:10.94ID:UVmsiduI Claudeは3.5 Sonnetが<antThinking>タグで回答前に簡易的な思考をしてるから、新しい推論モデルはそれの発展型だろうな
2025/02/18(火) 18:17:27.51ID:Cgjsih1U
o1 pro程度だとすればベンチマークにo1 proがない違和感も辻褄合うな
Deep Research便利過ぎるしOpenAIのままで良いかな
Deep Research便利過ぎるしOpenAIのままで良いかな
2025/02/18(火) 18:34:39.28ID:qbFElDRC
PCブラウザ版GPT
「おかしいだろ!」はOK
「なめてんのか!!」もOK
「おかしいだろ!なめてんのか!!」にした途端暴言と判断されるみたいで「コンテンツが削除されました」って表示されるのなぞこわ
「おかしいだろ!」はOK
「なめてんのか!!」もOK
「おかしいだろ!なめてんのか!!」にした途端暴言と判断されるみたいで「コンテンツが削除されました」って表示されるのなぞこわ
988名無しさん@お腹いっぱい。
2025/02/18(火) 18:42:21.88ID:wr02jwsZ GrokがO3相当って言われてもふーんとしか感じないのは感覚バグってんのかな
はよAGI来いとしか思わん
はよAGI来いとしか思わん
989名無しさん@お腹いっぱい。
2025/02/18(火) 18:43:35.54ID:UVmsiduI @elonmusk
Unhinged funny Grok coming tomorrow
Unhinged funny Grok coming tomorrow
2025/02/18(火) 18:43:36.70ID:7qQ2LnaV
AGIなんて月面着陸みたいな一般人には関係ない話だろ?
なんでそんなもん待ちわびてんの
なんでそんなもん待ちわびてんの
992名無しさん@お腹いっぱい。
2025/02/18(火) 18:46:35.51ID:RM76pScp 【ChatGPT】AIチャット総合 33【DeepSeek・Gemini】
https://mevius.5ch.net/test/read.cgi/esite/1739871879/
https://mevius.5ch.net/test/read.cgi/esite/1739871879/
993名無しさん@お腹いっぱい。
2025/02/18(火) 18:46:59.35ID:RM76pScp スレタイはまた次スレ終盤に考えるということで
2025/02/18(火) 18:57:06.90ID:lITndnL1
本当に無料でFlash Thinking超えというならGoogle涙目なんだがな
でもあくまでExperimentalなんだよな
Googleはもっと完璧なものを仕上げてくるはずだ
でもあくまでExperimentalなんだよな
Googleはもっと完璧なものを仕上げてくるはずだ
995名無しさん@お腹いっぱい。
2025/02/18(火) 19:12:18.53ID:qLcAyB3Y >>989
イーロンこういうの好きだよね
イーロンこういうの好きだよね
996名無しさん@お腹いっぱい。
2025/02/18(火) 19:25:20.70ID:RnSaSjaq 梅
997名無しさん@お腹いっぱい。
2025/02/18(火) 19:29:40.03ID:VvQ+2Aqy 先に埋めずに次スレに書くバカチンが!
2025/02/18(火) 19:34:01.61ID:ID1hUXVm
メタもLlamaを「Meta AI」としてフェイスブックやインスタグラムに統合してるんだね?
日本では使えないみたいだけど
日本では使えないみたいだけど
2025/02/18(火) 19:35:14.84ID:VWPcVEV9
>>991
風説で踊らされまくる未来が見える。
風説で踊らされまくる未来が見える。
1000名無しさん@お腹いっぱい。
2025/02/18(火) 19:36:35.79ID:ID1hUXVm Gro3kは、DeepSeekが出て他社が動揺していても、予定通りリリースするとイーロンがXで言ってたし
どこまで先を見通してるんだろうな?
どこまで先を見通してるんだろうな?
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 8日 7時間 22分 32秒
新しいスレッドを立ててください。
life time: 8日 7時間 22分 32秒
10021002
Over 1000Thread 5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
運営にご協力お願いいたします。
───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。
▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/
▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 備蓄米、小売店へ流通しているのは放出量の1.97%どまり ★2 [お断り★]
- 日本経済低迷の理由は日本人の意地悪さ説、前澤友作氏が私見「よく分かる」 [少考さん★]
- 【コメ】日本人の主食が変わる?価格高騰収まらない米に代わり 麺類、シリアルなど売り上げ増 [ぐれ★] ★2 [ぐれ★]
- 「スマホをカーナビ代わり」手持ち操作で一発免停のケースも、ホルダーに固定は安全運転義務違反も [お断り★]
- 石破首相、消費税減税に慎重姿勢 新たな経済対策「現時点で考えず」 [首都圏の虎★]
- 原因はヘビによるショート…停電で運転見合わせの東海道新幹線 午後7時に運転を再開 [首都圏の虎★]
- 【実況】博衣こよりのえちえちポケポケ開封🧪
- イギリス「ハマスの蛮行と同じことをやったのが人類で日本人だけだ」 [834922174]
- 【石破悲報】タマキン「総理大臣になったら日本をドラえもんのポケットのような国にしたい🤩」 [359965264]
- 会話ができないお🏡
- マクドナルド店員に凄いキレてる人がスレッズで話題、想像の1.5倍は怒ってる [605029151]
- 高市早苗さん、台湾の「安倍記念公園」の「安倍晋三銅像」に献花。 [744361492]