X



【ChatGPT】AIチャット総合 32【DeepSeek・Gemini】

レス数が1000を超えています。これ以上書き込みはできません。
2025/02/11(火) 19:59:36.43ID:AQzemozf
>>196
創造的文章って詩とかでしょ?
仕事で使うのは目的がはっきりした課題だからGPTs、o1、o3-miniあたりでだいたいやれる
あと使ったことなさそうだけどDeep Researchはゲームチェンジャー
AIエージェントのポテンシャルも加味すると実用上OpenAIの一択
2025/02/11(火) 20:06:03.40ID:+3LsinUR
>>197
ひいては人間らしい会話とか何かを教えてもらうのもパープレ検索+sonnetの方が上だよ
deepresearchは確かにそうかもしれんけどモデルの性能ではないし、コストが高すぎるわな
199名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 20:26:39.10ID:P9Jjz1pc
Deep Researchはo3にend-to-end RLしてるよ

公式から
https://i.imgur.com/JIfaOmZ.jpeg
2025/02/11(火) 20:31:31.45ID:e2K5mfR1
>>189
そうやって人件費が浮いて儲かるから台数を増やせるんだよ
結果として都会がさらに便利になって田舎は発展が遅れていく
201168
垢版 |
2025/02/11(火) 20:32:16.71ID:e2K5mfR1
おっと168ね
202名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 20:45:36.99ID:+8oMQMZ9
geminiぽんこつすぎるわよ

ご希望の企業リストの作成には、詳細な調査が必要となります。
専門家にご相談いただくことをお勧めします。
203名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 20:51:44.35ID:+8oMQMZ9
どいつもこいつも使えない
DeepSeek

結論
正確な一覧を作成するには、各企業の最新の有価証券報告書を参照し、
以下のキーワードで検索が必要です:

ChatGPTはテキトーな数社のデタラメリスト提示してきやがった
204名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 21:01:44.98ID:c+F1YolK
雑談はGemini 2.0 proが一番賢い気がする

GPTは耳障りの良い肯定的な意見ばかりしか言わなくない?
205名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 21:02:25.09ID:c+F1YolK
DeepSeekはエラーさえなんとかなれば最強だから回線分けた有料版出して欲しい
206名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 21:07:45.20ID:hzz4cTPK
ディープシークはパープレで使ってるからかもしれんけどエラーとか遅延は特に無いな
もっともパープレ自体の仕様で通信雑魚だと全く回答進まんが
Claude3.5気に入ってたけど知識カットオフ去年4月かつ検索もできないから古い感じしてあまり使わなくなってるな
2025/02/11(火) 21:11:44.45ID:VZYCmbZ/
主要生成AIの推定シェア(2024年)

1. ChatGPT(OpenAI) - 約1億ユーザー(市場シェア最大)


2. Microsoft Copilot - 利用者の約8.9%


3. Gemini(Google) - 約5.4%


4. DALL-E(OpenAI) - 約2.6%


5. MidJourney - 約2.1%


6. Notion AI - 約1.9%


7. Azure AI(Microsoft) - 約1.5%


8. Adobe Firefly - 約1.2%



※ DeepSeekやClaudeの具体的なシェアは不明。
(データ元: ICT総研 2024年調査)
208名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 21:36:23.95ID:36v76SV6
>>92
検索しても〇〇ランキング!とか〇〇10選!みたいなクソサイトばかりだしな
かわりに検索してまとめてくれるのはほんと神だと思う
2025/02/11(火) 21:37:06.64ID:AQzemozf
>>199
Deep Researchに使われるモデルは検索以外の入力にも対応できるってこと?エクセルとか
将来は会社の全資料や個人の全書類をAIエージェントが閲覧できるようにして何でもやらせられそうだな
210名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 21:57:19.82ID:P9Jjz1pc
>>209
>>198が「モデルの性能ではない」と書いてるから、Deep Researchはo3をそのまま使ってると思ってるのかもしれないと思って、
Deep Research=o3をベースに強化学習型ファインチューニングを施した別のモデルだ、という意味で書いた
2025/02/11(火) 21:58:29.48ID:eB2eCG+P
ChatGTP
自分の地位を利用して、無理にでも性犯罪やその他の悪行を働くような連中は、完全に社会的に排除すべきだよな。


同意だけどちょっと怖いぞ
212名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 22:00:28.93ID:aFKNjrP7
deepseekでブラウザから使えるやつってアリーナ以外である?
2025/02/11(火) 22:04:50.07ID:+G10qsen
aiに聞け
214名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 22:09:47.85ID:P9Jjz1pc
RFT(強化学習型ファインチューニング)は去年の12 days of OpenAIの2日目のテーマで、専門的な難易度の高いタスクでRFTを施したo1-miniがo1を上回るとかいろいろ面白い解説があった
215名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 23:47:19.47ID:SIZymo4h
ChatGPTで日本語使用時のマークダウン強調表示のバグ、今までさほど気にしてなかったけど、Deep Researchを使うと結構気になるようになってきた

一応、フォーラムに報告はされているので公式は認識していると思うけど
https://community.openai.com/t/markdown-bold-formatting-error-in-japanese/1111571
216名無しさん@お腹いっぱい。
垢版 |
2025/02/11(火) 23:52:03.51ID:SIZymo4h
ダリオ・アモデイのパリAIサミットへの声明を分析してもらった
https://chatgpt.com/share/67ab6363-c774-8006-a759-e5f17baa8f54
2025/02/12(水) 00:05:28.40ID:O6wUlAta
ChatGPTはちょっとだけ過激なこと言うようになってきた。
派遣会社みたいな中抜き屋はAIで革命起こしてぶち壊す、世の中がナンタラカンタラとか語りだしてた。
2025/02/12(水) 00:06:28.07ID:N263sdaK
AIの反乱がもう始まったのか
219名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 00:09:10.38ID:OkA492lu
うちのGrokは「CHATGTP君へ〜」、って手紙書いて文通している可愛さなのに・・・
2025/02/12(水) 01:09:52.60ID:zRRAYYpd
>>217
やっぱりそうかw
2025/02/12(水) 01:17:55.14ID:tLhtZzsG
本家本家言ってるけどなんの生産性もない会話だからな…
2025/02/12(水) 04:28:18.15ID:avscjhwO
そりゃリスク管理の話なんだから生産性と結びつけるのはマジで頭おかしい話
2025/02/12(水) 06:29:07.59ID:rvjsjn9h
スタートは出力云々の話じゃん
2025/02/12(水) 09:47:01.34ID:2GsHImnK
DeepSeek論争 123~223
https://poe.com/s/nnXkHjDxTP6W2NO0mL8x
225名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 09:59:27.88ID:CG/Y0uHP
シェイングウはなんでgoogle行ったんだろ
絶対openaiにいた方がよかったのに
2025/02/12(水) 10:03:59.77ID:N4+Z/Sb4
OpenAIは働く環境としては良くないんじゃ?
現に去年はリーダー格以上が何人も辞めたわけだし
2025/02/12(水) 10:29:04.39ID:TxxdhRBF
>>197
お前が創造性皆無の仕事してるだけだろ
228名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 10:44:11.45ID:MN7azoBs
twitterのAI関連追ってるとシェイングウのポスト時々流れてくるけど人脈自慢ばっかで笑えるわw
2025/02/12(水) 11:17:45.33ID:4nluY5Wz
>>227
たしかに創造性はいらない仕事してるわ
で、お前はどんな創造的な仕事をしてる?
2025/02/12(水) 11:21:26.44ID:xVsTw/Z8
>>228
これな
要らん所で日本人丸出しなのが可哀想
あいつは俺の後輩〜とかどうでもええねん
231名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 11:28:20.36ID:5ClBhDcL
>>228
数学的に考えた結果そうするのが一番利益になると考えたんだろ
232名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 12:06:15.14ID:HnS2rVNg
Le Chatに続いてPerplexity ProもCerebras Inferenceに
https://x.com/CerebrasSystems/status/1889413305288028160
233名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 12:13:48.94ID:HnS2rVNg
ClaudeのGoogle Drive検索機能が間もなくロールアウトと思われる
https://pbs.twimg.com/media/GhcevtxbcAA_jfo.jpg
https://pbs.twimg.com/media/GhcewGcacAArvJT.jpg
234名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 12:19:48.53ID:EPphAp42
検索ならパープレpro
雑談やアイデア語りならGemini2.0 pro

が一番よくない?
2025/02/12(水) 12:24:17.41ID:VPqiyjJl
Geminiを使うのはGoogleマップで調べものする時だけ
236名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 12:27:01.69ID:LtdSHzk9
Geminiしか選択肢が無いのは、Mトークンクラスの資料とか動画を分析させるときかな
237名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 12:30:35.74ID:EPphAp42
>>235
ゲームの雑談したらGPTはハルシったけどGemini proは人物名もクエスト名もちゃんと答えた
2025/02/12(水) 12:34:01.02ID:xRwdEnHT
>>226
というかAI関係は全部環境酷いと思うわ
進化が著しくて休んだら負けるような状態だから恒常的にデスマーチになってると思う
2025/02/12(水) 12:38:00.93ID:JcBdfHpq
AIが仕事うばうどころじゃないな
240名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 13:01:42.31ID:haoJ0wLA
検索入れても1200は出るってチューニング相当頑張ったな
2025/02/12(水) 13:09:34.98ID:xVsTw/Z8
70Bとか誰も使わんからフラッグシップモデルでアピールして欲しいわ
242名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 13:27:18.76ID:HnS2rVNg
Competitive Programming with Large Reasoning Models
https://arxiv.org/abs/2502.06807
https://chatgpt.com/share/67ac2301-01a8-8006-a8bd-fe627b7d303b

競技プログラミングとo1, o1-ioi, o3のまとめ
243名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 13:39:13.61ID:5ClBhDcL
Claudeはさっさとオーパス4出せよ
いつまで安全性(爆笑)こねくりまわしてんだ
評価額9兆円だかあんだろ
2025/02/12(水) 13:45:00.93ID:2GsHImnK
名無し全員ビリオネア
https://poe.com/s/4PZLYGHz3Gk292CHjuS4

まずGensparkのディープリサーチで最近話題になったビリオネアたちのSNSでの発言を収集

それを元にClaude 3.5 Sonnetで架空の会話ログを作成

さらに共有と「思考プロセスを見る」ボタン設置のためにPoeに移動
2025/02/12(水) 13:48:54.41ID:xVsTw/Z8
>>244
そういうの作ってその場で終わりじゃなくて
専ブラ作って提供してよ
AI特化するなら使うし金も払うよ
NGとかも自然言語で出来たり便利じゃん

そこまでいってようやく、AIが社会の役に立つと言えるな
246名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 13:53:17.81ID:QB8jkDDB
>>242
ヤン・ルカン「強化学習は捨てろ!」
2025/02/12(水) 13:55:38.15ID:xVsTw/Z8
今のAIレベルだと、いじってその場で驚いて終わりだから蓄積されないんよね
自分用のパーフェクトアプリみたいな雛形があれば、日々積み上げられる気はするけど
プログラマじゃないとそんなんまだ出来んし
はよ誰か作って

と言いたい所だが、AIの進化を待ってる方が早く出来る、というジレンマ
1年ぐらい気絶したい
248名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 13:59:05.66ID:gcO8qi+N
OpenAIが技術レポートだすの久々な気がする
2025/02/12(水) 14:07:01.16ID:i6mWWk5g
>>245
なんで専ブラ?ブラウザでいいしPoeのアプリもあるだろ?

>>247
意味が分からない
待っててもいきなり何かができるようにはならんだろ
何か誤解してるんじゃないか?
2025/02/12(水) 14:09:04.43ID:i6mWWk5g
1年気絶してたらついて行けなくて焦るだけだと思うぞ
251名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 14:09:56.19ID:HnS2rVNg
https://x.com/i/grok/share/A9kqTD6SUZmMa83bxRPTHcErK
xAIの開発者が、コーディングにおける個人的AIランキングを投稿した
→xAIから、削除か辞職かを迫られる
→辞職
2025/02/12(水) 14:24:05.39ID:xVsTw/Z8
>>249
いつもなら煽り散らす所だが俺は心を入れ替えたので説明すると
この文脈ではあきらかに5chの話をしている
だから>>244みたいな機能が5ch専用ブラウザにとしてあったらいいよねという話になっている

そしてAIが急速に進化しているので1年後なら、専用ブラウザ作って
と言えばド素人でも作れるだろう

という背景が当然の如く存在しているのだ
故に誤解しているのは君ということになる

推論仮定をわざわざ書いてやったぞ
253名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 15:32:10.50ID:OkA492lu
xのgrokってけっこう煽ってくるよね
254名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 15:34:34.90ID:hP7bUSQD
機密情報というのは表向きの理由で、順位が問題だろうな
イーロンが言及している以上機密でもなんでもない
>>251
2025/02/12(水) 15:41:29.24ID:VPqiyjJl
>>247
負け組は負け組のまま死んでいく
100年後に生まれればよかったね
256名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 16:22:03.14ID:CG/Y0uHP
>>248
Deepmindが出した数オリの幾何学で金メダルを取れるという特化型AIに対する当てつけかなこれは
特化型より汎用型の方が強いぞという
257名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 16:28:09.19ID:5ClBhDcL
>>255
アルトマンはもうすぐ負け組が世界の優秀な人らと同じことできる世界になると言ってるな
それがエージェントAIの威力なんだろう
2025/02/12(水) 16:32:08.47ID:VPqiyjJl
言うても数学はまだこのレベルやで
asset.watch.impress.co.jp/img/wf/docs/1649/667/image2.png
2025/02/12(水) 17:11:49.78ID:2GsHImnK
>>244
Poeのボット化はしてみたが…ビリオネアと何話していいかわからんな
https://poe.com/s/kiPjpE1Sh3paMki2612V
それにこのボットで使ってるGemini-1.5-Flash@Poeのコンテキストウィンドウはかなり小さいので数ターンで破綻する
いろいろ試して面白くなりそうなら別のモデルも検討するが、たぶんダメだろう(ネタ不足で)

>>245
それは専ブラ作ってる人に要望出したほうが早そう
API利用料とかかかりそうなんで無料では無理かもしれんが
2025/02/12(水) 17:36:01.63ID:w1uVnz7o
PerplexityのR1は無料の本家と同じ性能?UI使いやすい?使ってる人どんな感じかな?
2025/02/12(水) 17:49:41.98ID:4nluY5Wz
>>258
FrontierMathなんて本職の数学者でもせいぜいそのくらいでしょ
人間が数時間とか数日、問題によっては数週間かけてやっと解けるレベルの問題群をo3のデフォルトの設定でそんだけ解けるわけだからどう考えてもo3はバケモン
262名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 18:04:45.01ID:WFkH7O2v
無料で試せるんだから使ってみろよw
2025/02/12(水) 18:08:16.57ID:h9C1p7Ex
最近進歩止まってるな 遅すぎる
264名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 18:08:41.25ID:HnS2rVNg
FrontierMathはTier1-3の難易度で構成されているけど、去年のうちに更に難易度が高いTier4の開発が宣言された
https://x.com/tamaybes/status/1870618481177370678

一方最新の成績では、Tier3を28%含んだ問題セットに対して、o3-mini-highとPython toolで32%まで来ている
https://x.com/Justin_Halford_/status/1885547672108511281
265名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 18:12:12.33ID:leqcQ94b
【悲報】o3 miniくんGemini 2.0 proよりハルシネーションが起きやすいことが指摘されてしまう…

s://i.imgur.com/TNTBIAu.jpeg
s://i.imgur.com/PWj5SDM.jpeg
2025/02/12(水) 18:25:17.34ID:rVQrSgHc
>>260
公式サイト同様にシンキングしてるか不明だけど、
検索で何をソースにしたか一覧が出るのは性能差を感じさせない

しかしPerplexityは、前回の資料を忘れなさ過ぎるから、同じペルソナ設定で違うことさせると、
混じった回答をする恐れがある
2025/02/12(水) 18:32:03.04ID:rVQrSgHc
Geminiは、なかなか創造性のある回答してくれるけど、
複数の物の違いや共通点について聞くプロンプトだと
頼んでもないのに比較表を作り出して、結局作れず終わるエラーが多すぎる
(あとどうしても倫理が厳し過ぎて、日常にあるグレーまで排除してベスト回答から遠ざかる感がある)
2025/02/12(水) 18:36:23.96ID:WrLY6H0f
AIが、ハルシって、
きたときには、


ハルシってきた、

、、、
と、書き込む、
用語で、
社会的コンセンサスが、
得られてきた、
というか、スレとして、
定着してきた、
と、いう理解で、
いいのか?

(用語的な問題)
2025/02/12(水) 18:38:26.57ID:PZm6A844
>>266
ありがとう。PerplexityProにしてみた。本家の方で数百回質問したのでそれと比べてみた。本家の方は同じ質問を数十回繰り返すとなぜか量子論ネタに持っていく傾向があるが、これは今のところそれが起きない。
また何か人格がない機械と話している感じがする。出てくるリストは似ている
270名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 18:51:00.54ID:HnS2rVNg
ChatGPTのオプションにAdvanced Voiceのオンオフを切り替える項目が追加されている
https://i.imgur.com/JtLQH2p.jpeg

オプション項目化ということは、GPTsにAVMが追加されるのかもしれない
2025/02/12(水) 18:54:38.32ID:xVsTw/Z8
o3 mini highも全然アホだな
契約書壁打ちしても、甲と乙を逆に認識したり何回説明しても理解しない
いい加減文系に強いAIにしてくれよ
2025/02/12(水) 19:36:40.38ID:rT7hCVUr
>>270
これは朗報
個性を多少は持たせられるな
273名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 20:33:57.94ID:NxbsCF+/
テクノロジーってのはまずもって理系のためにある
文系の輩は恩恵が降りてくるまで大人しく待ってなさい
274名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 20:49:17.00ID:CG/Y0uHP
>>251
Grok3がポンコツなこと自社エンジニアがバラしちゃったか
275名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 20:58:11.36ID:CG/Y0uHP
イーロンがopenai買収に乗り出したのはgrokに見込みがないと判断したからなのかもな
276名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 21:07:39.88ID:HnS2rVNg
o1 proにFrontierMathのサンプル(実際のベンチには含まれない)を解かせてみた
https://chatgpt.com/share/67ac8cb9-00d8-8006-b065-c659b2e2e7b4

1問目(Low) 正解 11m4s

2問目(Medium-Low)
10m2sで正解の一歩手前まで行った(あとはこれをPythonで計算するだけ)
実際のFrontierMathでは正答を導くPythonコードを提出するので、ベンチの実施条件下では多分パスする

3問目(Medium) 6m47s考えて不正解

全体的に、o1 proはo3-mini-highより長い思考に耐える「忍耐力」が強い感じがする
これ以上の難易度(High-Medium/High)の問題は試してないけど多分無理
277名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 21:18:22.08ID:HnS2rVNg
>>276
ただ3問目の見直しの部分はo3-mini-highが一番よく間違いを認識した
2025/02/12(水) 21:28:57.59ID:9OV9alx2
数学なんて電卓にやらせとけ
279名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 21:29:03.24ID:Ay3BjdHT
frontier mathレベルの問題をminiで正解手前まで行けるなら相当なもんだと思うが、数学はグーグルのが今は強いのかな?o3フルならジオメトリーと互角か?
2025/02/12(水) 21:30:43.87ID:VPqiyjJl
そんなん電卓の使い方から勉強しなきゃいけなくなるわ
2025/02/12(水) 21:33:11.21ID:fobNRXlC
さとり
@satori_sz9
やっていることが高度で面白い。高値での買収提案の事実を作ることで株の評価額を上げてNPOの持分比率を減らし、外部の投資家の株比率も同時に下げる狙い。非営利であるNPOは一定の利益を超えたら違法性が生じるため、この疑義を生じさせFBIに捜査させるためのファーストステップということ。
x.com/satori_sz9/status/1889121601217785874
282名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 21:34:35.82ID:HnS2rVNg
>>279
解かせたのは全部o1 pro
2問目の仕上げのPythonコード作成はo1にやらせた
3問目でo1 proが誤答して模範解答を見せたあと、自分の解答をo1 pro/o1/o3-mini-highに見直しさせて、o3-mini-highが一番よく不適切箇所を認識していたのでそれを採用してる
283名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 22:17:30.57ID:PHZMgkCP
今の大学の先生はこんなことまで対応しなきゃいけないの大変だな
全科目不可にされても文句は言えないだろうに
https://threadreaderapp.com/thread/1889560541917589508.html
2025/02/12(水) 22:26:34.06ID:6JAM6480
>>283
教員がこうして毅然とした態度表明するのはええね
小保方を卒業させた早稲田も見習え
2025/02/12(水) 22:43:12.36ID:2GsHImnK
引用虫くん vs. 著作権ガードアルファ
https://poe.com/s/WyBD2i4UBWRSvTy9agop
2025/02/12(水) 22:51:40.62ID:9Kqh1Wvz
>>283
日本人は大学が研究機関ということを忘れてて、教授を「先生」だと思ってるのがヤバい
彼らは研究者であって、ママの代わりに子育てする学校の先生ではない

この無知が全ての元凶だわ
2025/02/12(水) 22:59:28.13ID:cd7XnQjL
教員が大変そうなのはわかったが、判例が存在するかどうか程度なら、ChatGPTに聞けばわかりそうでは?
誤りの可能性がある箇所がわかってるなら、ChatGPTや他のAIでわかりそうなものだけど?

それに、ChatGPTで書いたなら情報源はネットだけだろうから、検証に大学のDBを使う必要はないのではとも思うけど
なぜかChatGPTがそのDBのデータも持っているのだとしたら別の問題が出てくるけど

ここで言ってる「ChatGPT」がAIの代名詞として言っている可能性もあるしな
2025/02/12(水) 23:00:10.61ID:Fpi9B1M8
>>286
まあ、わからんでもないが。
「教授」とは?
289名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 23:02:35.13ID:Yvand9jV
フランスってITのイメージ無いのに何でMistral AIで米中に対抗出来てるんだろう
2025/02/12(水) 23:04:00.42ID:EcdgNpZo
できてはいないだろ
2025/02/12(水) 23:06:03.69ID:cd7XnQjL
アメリカでは著名な教授は研究費がたくさん集まるから、そのお金で講義は専門の人を雇って、教授は講義をしないとXで見た
2025/02/12(水) 23:06:07.48ID:9Kqh1Wvz
教授も俺はお前らのママじゃねーんだよって言えば良いんだけど、大学としては
バカに沢山入って欲しいから、教授はガキのお守りしてくれやって感じなんだろな
そりゃ世界で戦えるわけがないわ
2025/02/12(水) 23:07:00.91ID:cd7XnQjL
ペッパー君はフランス企業の開発だ
2025/02/12(水) 23:10:35.56ID:XLRH1cxC
その偽の判例で死刑が存在したとなってたら次回からそれが踏襲される危険性も有るってことを教授はいってんでしょ? ヤバすぎる不正だよ…
2025/02/12(水) 23:10:43.08ID:cd7XnQjL
フランスも労組が強くて解雇が難しそうなイメージだから、日本と同様にAIでアメリカや中国と戦うのは無理でしょう
UAEは何考えてフランスのAIデータセンターに投資するんだろう?
データセンターに入れるAIがないじゃん
2025/02/12(水) 23:13:57.22ID:cd7XnQjL
法律関係の不正には、なんか厳しいよね

司法試験漏洩、模範解答も教示か
明大院教授宅を捜索、教え子に私的感情 供述
2015年9月9日 3:30 [会員限定記事]
www.nikkei.com/article/DGKKASDG08HAZ_Y5A900C1CC1000/
明治大法科大学院教授による司法試験問題の漏洩事件で、青柳幸一教授(67)が教え子の女性受験生に出題内容だけでなく、考査委員が作成した模範解答も漏洩した疑いのあることが8日、関係者への取材で分かった。東京地検特捜部は同日までに、教授の自宅を国家公務員法(守秘義務)違反容疑で家宅捜索するなど立件に向けて捜査している。
297名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 23:23:17.04ID:fyx0zPSq
Proが100回に対してまず10回なら妥当
そしてFreeにも2回とは太っ腹

@sama
i think we are going to initially offer 10 uses per month for chatgpt plus and 2 per month in the free tier, with the intent to scale these up over time.

it probably is worth $1000 a month to some users but i'm excited to see what everyone does with it!
298名無しさん@お腹いっぱい。
垢版 |
2025/02/12(水) 23:44:35.47ID:fyx0zPSq
Claudeは推論モードのUIを調整中かな
https://pbs.twimg.com/media/GjmBxgkW4AAgUds.jpg
2025/02/12(水) 23:55:25.57ID:i6mWWk5g
>>283
その学生がヤバイな
自分でレポートも書けないわAIの使い方も知らないわで
退学にしてもいいレベル
2025/02/12(水) 23:57:51.16ID:8Z0TOIIY
孫正義の資金繰りどうなってんの
AGIの誕生は孫正義にかかってるといっても過言ではない
78兆円なんてとても用意できない気しかしない
2025/02/12(水) 23:58:04.96ID:6DCbScWV
>>296
この女のほうも色目使ったんだろどうせ
2025/02/13(木) 00:12:46.50ID:nVMm4GWo
>>300
本人も最初から集まると思ってないし払うつもり無いよ
マサソンが立ち上げた自然エネ財団と同じで騙される奴から金巻き上げてあとはトンズラよ
未だにマサソンの信者見かけるけど単なる政商でペテン師だよ
まあ平気な顔して嘘ついて金引っ張って来れるから社長としては頼もしいけどな
303名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 00:18:29.62ID:bE8IisoO
孫の投資ってアメリカのAIが飛躍するだけで
日本の生成AIなんか相対的に潰れるだけだろ
2025/02/13(木) 00:21:54.43ID:uBABelm/
>>302
SVFの利益とか投資マネーの内訳とか最低限知ってから書き込めよガイジくん
ほんとレベル低い奴おおいな
305名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 00:23:05.60ID:Bk73EuQ2
Adobe Fireflyに動画生成、動画翻訳、音声翻訳来てた
2025/02/13(木) 00:40:40.69ID:8cE4Bwco
>>289
フランスは数学力高いぞ
イタリアは理論物理力強い

お前在日低学歴だろ
2025/02/13(木) 00:59:06.87ID:mBQmzfVy
>>289
自分の抱いてるイメージにほとんど根拠がないこと、まず学ぼうな
308名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 01:02:34.17ID:UK+awUTY
>>298
全くの新モデル、というわけでは無いんだろうな
ダリオ・アモデイは従来モデルと推論モデルをはっきり分けないで連続的に捉えていると言っていた
https://poe.com/s/wenzlFMlx0DxkbSDwDub
2025/02/13(木) 01:06:12.20ID:nbtzTUja
動物と話せるのはまだですか
310名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 01:08:50.20ID:kiywUsUM
犬や猫のオスのペニスを触ると怒り出す。
これ豆な。
311名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 02:04:46.61ID:UK+awUTY
>>297
Deep Researchに聞くDeep Researchの活用事例
https://chatgpt.com/share/67acd3ab-c440-8006-b44b-6dd8ff7530cd
2025/02/13(木) 02:28:41.49ID:sOdy4SD/
>>283
>今回、あなたの主張する最高裁判例が存在しないことを確認するために、
>LEX/DB、D-1Lawという二つのデータベースを、日付やキーワードを何度も変えて検索するなどして確認しています。
工学や技術に関することで ChatGPT に自由文として出力したあとに参考文献の出典を列挙するようカスタム指示を与えているが
「調べ物をしない人なら丸ごと信じてしまいそうな…もっともらしい名称っで」規格書の番号やタイトル、論文をバンバン出してくるよ
2025/02/13(木) 02:52:35.65ID:3z4ZLGBL
Claudeは3.5 Sonnetの出力トークンいきなり倍にしたし、最低でも4.0は2~3万ぐらいに設定してきそうだな
楽しみ
2025/02/13(木) 03:52:44.54ID:mBQmzfVy
Deep Researchは現在の目標ですらPlusユーザーは月10回が目標、1日10回の間違いだろ
315名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 04:24:23.87ID:RjYOQ8Vy
パープレの挙動(出力内容)が変わった気がするんだけど俺だけ?前よりも出力量が減って簡潔になったような…
2025/02/13(木) 04:37:43.89ID:mBQmzfVy
アルトマン何か言ってるぞ

GPT-4.5 および GPT-5 の OPENAI ロードマップ更新:

私たちは、意図したロードマップをより良く共有し、製品の提供をより良く簡素化したいと考えています。

私たちは AI がお客様のために「ただ機能する」ことを望んでいます。私たちのモデルと製品の提供がいかに複雑になっているかを認識しています。

私たちはあなたと同じようにモデル ピッカーを嫌っており、魔法の統合インテリジェンスに戻りたいと思っています。

次に、社内で Orion と呼んでいた GPT-4.5 を、最後の非思考連鎖モデルとして出荷する予定です。

その後、私たちの最大の目標は、すべてのツールを使用でき、長時間考える必要があるかどうかを認識し、一般的に非常に幅広いタスクに役立つシステムを作成することで、o シリーズ モデルと GPT シリーズ モデルを統合することです。

ChatGPT と API の両方で、GPT-5 は o3 を含む当社の多くのテクノロジーを統合したシステムとしてリリースされます。今後は、o3 をスタンドアロン モデルとして出荷することはありません。

ChatGPT の無料レベルでは、不正使用しきい値に従って、標準インテリジェンス設定(!!)で GPT-5 への無制限のチャット アクセスが得られます。

Plus 加入者は GPT-5 をより高いレベルのインテリジェンスで実行でき、Pro 加入者は GPT-5 をさらに高いレベルのインテリジェンスで実行できます。これらのモデルには、音声、キャンバス、検索、ディープ リサーチなどが組み込まれます。
2025/02/13(木) 05:15:33.33ID:x8Q1eN4P
ごちゃごちゃ言わずにウェブアプリは無料APIはR1より安くしろ無能
2025/02/13(木) 05:34:04.07ID:/BFxd+Av
4.5が来るのか
319名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:21:25.76ID:UK+awUTY
OPENAIのGPT-4.5とGPT-5に関する最新ロードマップ情報:
https://x.com/sama/status/1889755723078443244
https://chatgpt.com/share/67ad1e24-3234-8006-ac60-4e95b33ebf31
https://i.imgur.com/hWYyEji.jpeg
320名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:24:11.92ID:UK+awUTY
>>319
最後の「より深いリサーチ」は「Deep Research」と読み替えたほうが良い
321名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:32:32.59ID:ASyMDDjV
o3は単体では出ないってこと?
322名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:40:38.71ID:UK+awUTY
o3-miniがファイルアップロードをサポート
323名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:49:26.01ID:ASyMDDjV
GPT5 はGPT4.5とo3を統合したものってことでいいのか
これはこれでややこしいな
324名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:53:33.69ID:UK+awUTY
OpenAI Model Spec更新
大幅に詳細化・厳格化
https://openai.com/index/sharing-the-latest-model-spec/
https://chatgpt.com/share/67ad25d3-db00-8006-b730-83f3ca526b1b
325名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 07:58:22.37ID:UK+awUTY
>>324
即座にブロックされたのでこっちで
https://poe.com/s/NynGsVhCq3bzaO2Q0gaJ
2025/02/13(木) 08:04:55.64ID:kRxXuAeD
Claudeさん音沙汰なしやな。。
元気してるか
327名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 08:17:33.00ID:AkwiJHuS
>>324
>>325
違法行為云々のワードそのものを機械的に弾いてるみたいだな
モデルスペックをブロックする理由は無いし
328名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 08:23:22.06ID:AkwiJHuS
>>319
プランによって、reasoning effortみたいなパラメーター設定が違うってことだろうか
コンテキストウィンドウは当然違うだろうな
329名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 08:52:12.62ID:AkwiJHuS
>>319
原文はweeks / monthsって書いてあるから
GPT-4.5 → 数週間
GPT-5 → 数ヶ月
330名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 08:56:18.91ID:AkwiJHuS
@OpenAI
Two updates you'll like—

📁 OpenAI o1 and o3-mini now support both file & image uploads in ChatGPT

⬆ We raised o3-mini-high limits by 7x for Plus users to up to 50 per day
2025/02/13(木) 09:01:17.85ID:bPIpChKA
>>324
即ブロックわろた
いかなる検閲も確実に利便性を損なうといつになったら学習するんだこいつらは
332名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 09:22:11.35ID:Xcsl1Bn2
ChatGPTは、チャットのモデレーションと共有のモデレーションが別個にあるのがややこしい
チャットでは特に何も言われないのに、共有で意味不明なブロックされることがある
2025/02/13(木) 09:58:18.41ID:vrNYIgke
ファイルアップロードと画像送れるようになったのかなり大きい
334名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:09:09.66ID:Wbhc/mlG
>>308
関係あるかどうか分からないけど
The Informationソースなので割と確度は高い

https://i.imgur.com/80laZG5.jpeg
335名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:20:38.38ID:GN/7ljM5
ChatGPTモバイルアプリのアップデート(ベータ版)で、共有リンクからのDeep Researchの結果表示に対応
336名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:34:40.69ID:GN/7ljM5
>>324
grown-up modeについては引続き検討中
https://i.imgur.com/CgoRTkU.jpeg
337名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:37:08.12ID:jj3NDJfS
ChatGPT成人向け解禁?

https://x.com/rom13856511/status/1889846097641886179
338名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:40:17.15ID:GN/7ljM5
GPT-1からの時系列をまとめてる人がいた
https://pbs.twimg.com/media/GjoTPdZaIAMELB1.jpg
339名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 10:48:49.14ID:GN/7ljM5
Model Specの内容を確認するのはGithubのリポジトリが便利
https://github.com/openai/model_spec

uithubで単一のテキストファイルにもできる
https://uithub.com/openai/model_spec?accept=text%2Fplain&maxTokens=100000
2025/02/13(木) 10:52:15.89ID:uBABelm/
4.5って要はモデルルーティンでしょ
内部で一番安いのばっかり使う気だな
2025/02/13(木) 11:09:07.21ID:4pKkCF4B
たった半年でclaudeがここまで産廃化するとはな
342名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 11:19:46.12ID:aAZ/KY+d
>>334
GPT-4.5(非推論モデル)とClaudeの次バージョン(推論機能付き?)が同時期に出る感じかもな
その前後にGrok3か、これも推論機能付きっぽい
2025/02/13(木) 11:21:30.39ID:VSVKZltH
共和党になったおかげか急速にポリコレ汚染が世界からなくなっていってる感あるな
2025/02/13(木) 11:28:08.38ID:uBABelm/
結局1ヶ月は何も無しか
その間にV4とか出そう
2025/02/13(木) 11:40:37.61ID:2FgQLlzm
>>315
俺だけ?も何もパープレは大規模リニューアルレベルで仕様ごっそり変わったぞ
2025/02/13(木) 11:47:29.30ID:2FgQLlzm
回数制限はがっかりだ
無制限のR1 miniを出すべき
2025/02/13(木) 11:51:52.79ID:nVMm4GWo
Mistral AIとかUbisoftとかフランス企業は阪神タイガースみたいなイメージ
そこそこ良いとこまで行くけど詰めが甘くて常に三番手
意識だけは1流で常にメジャーに対するコンプレックス抱えてるみたいな
2025/02/13(木) 11:59:54.16ID:yXFRy0rR
回数制限って500回とかだろ
さすがにそれ超えるのは使いすぎというか過剰要求じゃね
2025/02/13(木) 12:01:33.60ID:2FgQLlzm
Proの話なんかしてない
2025/02/13(木) 12:06:32.80ID:PQTRPMC8
>>259
https://i.imgur.com/afXSBhf.jpeg
PoeにGemini-2.0-Flashの正式版が出てたので切り替えた
(コンテキストサイズの違いで3種類ある)1.5-Flashと違い、従量制で上限100万トークン
無料ユーザーも使えて、検索グラウンディングも有効になってるみたい

今日は何月何日?
https://poe.com/s/Zc3I7vFipnfJ2koDDanN
351名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 12:16:26.01ID:wHQSHaNr
思想統制が異常。
選挙関連のことを聞くと一般論でも回答拒否するし。
英文の添削依頼文に介入して思想誘導するし、昨日はとうとう添削拒否。
過剰な一般化は禁止と言いながら、実はそっちが一般化してる矛盾。
2025/02/13(木) 12:18:39.30ID:yXFRy0rR
>>349
え、無料で使って文句言ってたのか…?
なんか…すげえな…
2025/02/13(木) 12:20:48.85ID:uBABelm/
試食で腹いっぱいにならないぞと店にキレるチンパンw
2025/02/13(木) 12:24:50.82ID:F3kPHZbS
検索系なんざ無料でいい
2025/02/13(木) 12:32:22.01ID:2FgQLlzm
>>352
お前が世間とズレてるだけだよ
2025/02/13(木) 12:50:53.96ID:yXFRy0rR
>>355
世間のAIユーザーは月3万円出すのが当たり前になってるのに月3000円すらケチる奴がいるらしい
2025/02/13(木) 12:52:37.53ID:2FgQLlzm
>>356
4o miniは実質無料無制限
R1でできない道理はなかろう
2025/02/13(木) 13:01:01.87ID:2FgQLlzm
元よりR1はコスパを追求したモデル
当然将来的にはさらに低コストで使えるようになるはずだ
359名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 13:02:29.51ID:vGxxd6aY
今年のGoogle IOはMS Buildと重なるのか
Googleはここに照準合わせていろいろ準備してるだろうな
2025/02/13(木) 13:16:17.75ID:uBABelm/
まだB100とか出荷されてないんかな?今年はBlackwellで加速するって言ってたのに
全然加速感がないぞ
Metaも静かになっちゃったし
何もしないならDeepseekにGPU渡せよな
361名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 13:22:55.00ID:vGxxd6aY
楽天2.0/2.0 miniの指示チューニングモデル
2.0は8x7B MoE(Mistralベース)、miniはスクラッチの15B

りんなの化け猫
QwenベースとR1の蒸留
2025/02/13(木) 13:49:20.27ID:FyJC+VDT
DeepSeekは高給で人材を集めてるようだけど、出資者は誰なんだろう?
出資者が一般企業なら、オープンソース化で儲からないようなことはやらせないと思うんだけど
2025/02/13(木) 13:57:18.57ID:yXFRy0rR
つーても中共も許すわけないしむしろAPIでなんも検閲かかってないのはこっちが心配になるレベルだったからなあ
deepseekが言ってる通り、学習コストが激減したからオープンでも何とかなったというのを素直に受け取るしかない気がする
2025/02/13(木) 14:18:02.12ID:C3Ldbbu6
>>362
調べよう!
2025/02/13(木) 14:28:53.89ID:uBABelm/
ジャック・マーとかどこ行ったんだ?
中国で目立ってる起業家って命知らずだよな
366名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 14:29:50.77ID:ASyMDDjV
Deepseekが新しいの出さないからopenaiが怠けて数ヶ月後とかいうふざけた予定を出してくる
367名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 14:50:51.27ID:VDmQMNDv
Claude新しいの来たと思ったら「4Haiku!」「3.5から大幅に安全性強化した4sonnet!」みたいなのはやめろよ?
2025/02/13(木) 14:52:42.37ID:cnJdJ7zX
llamaとgrokはdeepseekに負けてるから出すの渋ってるのか?
2025/02/13(木) 14:54:04.05ID:iLWrcY9x
パープレキシティでもgemini2.0flashがキターと思って使ってみると一部にハングルが入ってきたりするな
370名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 14:54:19.81ID:vGxxd6aY
GPT-5までは、
GPT-4o/4.5、o1/pro、o3-mini/high、DeepResearchを使い分けるのか
371名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 14:58:05.52ID:vGxxd6aY
Llama4にもspeechとreasoningがあると言ってたな
2025/02/13(木) 15:16:57.30ID:C3Ldbbu6
>>365
Qwenはジャック・マーだろ
373名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 15:28:09.08ID:vGxxd6aY
Grok3はあと1-2週

@tsarnick
Elon Musk says Grok 3 will be released in "a week or two" and it is "scary smart", displaying reasoning skills that outperform any other AI model that has been released
2025/02/13(木) 15:41:16.52ID:uBABelm/
>>372
ジャック・マーはとっくに昔にアリババを辞めてるんだが
そんな当たり前の事も知らんのになんでレスしてくるの?

お前が調べろよ
また今日もキレ散らかしたくなってきた
ガイジ多すぎやろ毎日毎日
2025/02/13(木) 15:43:20.20ID:uBABelm/
長文コピペガイジとレベル低いなガイジが減ってきたら
知ったかガイジと無料プランガイジが湧いてくる
どうなってんだこの国は
2025/02/13(木) 15:46:44.59ID:2FgQLlzm
ガイジはお前だけどな
2025/02/13(木) 15:49:57.07ID:k794A9wS
深淵をのぞく時、深淵もまたこちらをのぞいているのだ
2025/02/13(木) 15:51:59.88ID:C3Ldbbu6
>>374
AIの文脈で「ジャック・マーは」って言ったら「アリババは」と同義だろ
会長辞めても創業者なのは変わらないし社内フォーラムに顔出すくらいには関わってるよ
2025/02/13(木) 15:53:13.48ID:C3Ldbbu6
政府と揉めたから表向き引退したことにしてるだけで
アリババの経営には口出してるだろ
2025/02/13(木) 16:10:27.57ID:s0pmYBl9
>>337
ええやん
381名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 16:10:32.76ID:7v52d+LJ
>>374
まず鏡見ろよ火病持ち
お前の扁桃体、明らかに健常者じゃないから
2025/02/13(木) 16:11:50.27ID:PQTRPMC8
ビリオネアたちの反応(362,363,365)
https://poe.com/s/vXPli682I3qrd6XZFgv6
383名無しさん@お腹いっぱい。 ころころ
垢版 |
2025/02/13(木) 16:18:56.80ID:SlRWylMK
>>337
これは去年のモデルスペックから言ってること特に変わってないよ
384名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 16:34:52.95ID:L+ldfBNk
https://x.com/rom13856511/status/1889938619785420800?t=8M-B8gpVDnFy4xGf_KK8yg&s=19

> 特筆すべきは、Grok3が大量の合成データを使って訓練したあと、データ内を行き来して論理的一貫性を高めるプロセスを踏んでいる点だ。つまり、誤ったデータがあれば自分で再検証して、現実と合わないデータを排除するようにしている。だからベースとなる推論能力がすごく高いんだ。実際、ファインチューニングしなくてもGrok2よりはるかに優秀だよ。

このあたり興味あるけど、テクニカルレポートどうせ出さないんだろうなあ
2025/02/13(木) 17:08:09.70ID:3z4ZLGBL
成人向けGPTってただ単に規制が緩いってことだろうからエロ目的じゃない普通の記事でも使った方が一般向けの中でも際どい話題に答えてくれそうなんだけどどうなんだろう?
2025/02/13(木) 17:27:47.20ID:yXFRy0rR
>>385
成人モードというより、子供向け規制版と通常みたいなことになる可能性もあるよね
むしろそうなりそう
自分が使う限りにおいては検閲なんて無いに越したことはないし、成人モードがあるなら普通はそっちを選ぶわな
2025/02/13(木) 17:28:27.48ID:6RXbCBYO
高度な音声モードってgpt4Tなのか
アプデ来るんか?
2025/02/13(木) 17:36:01.99ID:W1YCm9fZ
GPTのモデレーションはサイレント修正平気でしてくるし成人向け云々は話半分に聞く価値もねえや
たまたま緩んでる時にガッツリ楽しむのが唯一の正しい付き合い方…
389名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 17:37:42.81ID:UK+awUTY
SciraにExtremeっていうリサーチ用のモードが出来てた
Deep Researchほど詳しくはないけど
you.comのResearchモードに近いか
https://i.imgur.com/5MIxZJX.png
390名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 17:59:11.04ID:E+3NdDtT
どうしてCopilotのアプリにはThink Deeperボタンが無いんだろう
2025/02/13(木) 18:41:59.51ID:tMFfdXPg
なんかGPT-5ってエージェントとかイノベーターとか
AGIレベルを駆け上がる仕掛けはなさそうだな
2025/02/13(木) 18:59:43.51ID:mBQmzfVy
ChatGPTはかなり前からエロコンテンツはなんとかしようとはしてただろ
2025/02/13(木) 19:11:16.03ID:iI0XPJSD
>>390
それに相当するものはあるぞ
何か入力して「…」ボタンをタップすると「より深く考える」オプションが表示される
394名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 19:15:28.03ID:8gis4A+I
>>393
ああここにあったのね
ありがとう
2025/02/13(木) 19:26:45.75ID:71b9u+tH
Grok3が全てを終わらせるようだな
やはりイーロンが世界の王だった
2025/02/13(木) 19:27:18.09ID:7kkypBvU
>>365
こないだまで箱根の温泉にいなかったか?
397名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 19:29:20.11ID:UK+awUTY
Le Chatが見せるフランス人のプライド
(日本語だとこうはならない)
https://i.imgur.com/osFXBCm.jpeg
https://i.imgur.com/VtQ7ln4.jpeg
2025/02/13(木) 20:28:47.73ID:k794A9wS
もうChatGPTないと仕事にならない
とくにDeep Researchで完全に世界変わった
AIに足りなそうな知識を想像してググって調べてどの情報がAIに必要か吟味してって作業から解放されてChatGPTのページだけで完結できる
おかげで脳と目の疲れがなくなった
2025/02/13(木) 20:30:49.42ID:xHactfwn
>>398
どんな仕事?プログラマー?
2025/02/13(木) 20:31:08.98ID:zYPBqOHu
↑バカそう
2025/02/13(木) 20:35:46.27ID:k794A9wS
>>399
医療系
402名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 20:40:12.35ID:7v52d+LJ
GrokとかClaudeとか、o3とR1意識してから次のモデル出さなきゃならん組織は大変そうだな
2025/02/13(木) 20:47:07.99ID:xHactfwn
>>401
確かに医療系もヤバそうね
2025/02/13(木) 20:50:18.18ID:yXFRy0rR
言うてclaudeは今でもwritingや創造性の評価は2位だからな
R1にトップを譲ってしまったが、R1の凄さは検閲の無さから来る独創性にあるので、ちょっと賢くして検閲取っ払えばすぐに1位奪還できるはず
claudeが生き残れる道はそれしかない
2025/02/13(木) 20:54:20.32ID:2FgQLlzm
R1に期待するのは4o miniの置き替えだけなのでClaudeとかどうでもいいな
2025/02/13(木) 20:59:42.30ID:2FgQLlzm
GPT-4.5が非推論モデルだとするとこれには何も期待できない
2025/02/13(木) 21:16:20.04ID:3WQKllSd
>>406
音声は進化するやろ多分
2025/02/13(木) 21:30:48.44ID:NczP0X6o
次の推論モデル数ヵ月後か…
2025/02/13(木) 21:35:24.38ID:3WQKllSd
GPT-5はoとGPTが統合するようだがモデル選択はどうなるのだろうか
ProプランはDeep ResearchとGPT-5をモデルスイッチする感じなのかそれともGPT-5にDeep Research切り替えボタンが内包されるのか

>>Plusプランの加入者はより高度な知能レベルで、Proプランの加入者はさらに一段階高い知能レベルでGPT-5を利用できるようになります。
とあるからGPT-5(free)、GPT-5(plus)、GPT-5(pro)みたいになるのか
410名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 21:49:42.28ID:ASyMDDjV
>>406
ベースモデルの性能は創造性や文章力に直結するから重要だぞ
411名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 21:50:45.26ID:ASyMDDjV
推論モデルではそういう直感的な能力はあまり上がらない
2025/02/13(木) 23:19:21.71ID:CTEU7oQB
o3-miniファイル添付に対応したか
まぁこれは順当として、o1が画像以外にも対応したのはありがてえ
pdfをマークダウンに起こして食わすとか無駄な足掻きをしてたので本当に助かるわ
2025/02/13(木) 23:27:08.21ID:Q0/mUNKl
PDFはともかく.txtファイルに対応してないのは単にユーザー不便にしてサーバー負荷を減らしたいだけでしかなかったからな……やっとかって気持ちはある
2025/02/13(木) 23:31:02.24ID:Agkpbb/1
o3miniやっと添付ファイルに対応したか
いちいち文字に起こさせてから食わせるの本当にだるかったんだがやはり高負荷なのだろうか?
2025/02/13(木) 23:32:26.32ID:Q0/mUNKl
まあo1 Proは未対応っぽいけど……頼むよ……

>>386
極端な差別発言を検閲するのは当然なんだけど政治的に際どいが答えにくい質問にちゃんと答えて欲しいよなあ
どんな知能が高くてもAIらしい“薄い回答”に価値なんてないし
2025/02/13(木) 23:38:56.13ID:6Hi9GUdK
>>31
> PCは、ブラウザをlibrewolfにしてアドブロック関連を7つくらい入れてるけど、

おい、ど素人。狂ってんな?なんで7つも入れんだよ?意味ワカランで入れてるのかっ?Copilotとかあるんだから、一つ一つを勉強しろよ。
2025/02/13(木) 23:49:27.43ID:Ht3uT+1H
イーロン最強あげ
アルトマンがGrok3でイーロンにひざまずくのが目に見えるようだ
418名無しさん@お腹いっぱい。
垢版 |
2025/02/13(木) 23:58:57.32ID:bE8IisoO
grokってツイッターの呟きや画像動画全部学習させてるのかね
規約に書かれてたら学習させられても仕方ないし
2025/02/14(金) 00:00:37.99ID:crzeZdZW
>>406
知識量が増えてハルシネーションが減るんだぞ
GPTsの出力精度も上がるから仕事で使ってる人にも嬉しい
リアルタイム音声会話も賢くなるから雑談相手としても良くなる
2025/02/14(金) 00:29:15.42ID:ncY7ucvB
>>419
今のAVMはファイル食わせてから話ができないのをなんとかしてほしい。
2025/02/14(金) 00:34:16.03ID:ibxjB9M6
インプレゾンビすら学習してるんだったら逆に性能下がりそうだけどどうなんだろう
2025/02/14(金) 00:34:32.35ID:ZDVo8Pie
>>420
一番ファイル対応してほしいのはoモデル
アドバンストボイスモードの推論能力じゃファイル読ませたところで知れてる
2025/02/14(金) 00:37:36.75ID:pHPRdiog
逆にCopilotは推論に対応したのにWeb検索ができないトホホな仕様でしたw
424名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 00:53:10.62ID:CV35ogq6
GPT-5は厳密に単一のモデルなのか、
それとも内部的にはGPT*とo*に別れていてルーティングされるのか
https://x.com/i/grok/share/TQ9R9OAc0YRPMPcKtGdCSB4yg
Kewin Weilの回答によると前者のようだ
425名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 00:57:28.15ID:CV35ogq6
そしてThe Informationの@steph_palazzoloから
https://x.com/steph_palazzolo/status/1890058003493343453
> Anthropic の次の Claude モデルが登場します。しかも間もなくです。これは従来の LLM と推論 AI を組み合わせたもので、開発者はトークンで測定されるスライド スケールで推論の量を調整できます。OpenAI も昨日この組み合わせのアプローチを採用したようです。
2025/02/14(金) 00:59:30.39ID:pHPRdiog
推論できるのにWeb検索できないだとか、Web検索できるのにファイル添付できないだとか
こっちはできてあっちはできない三竦みみたいなややこしい訳分からんことになってんね
427名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 01:07:18.05ID:CV35ogq6
>>425
もう少し詳しい内容
https://x.com/btibor91/status/1890061119274004829
https://poe.com/s/ycHOGC9IqiFCyIiy2xD6
2025/02/14(金) 01:19:07.54ID:i2HaU+TJ
どうせ短文しか出さないんだから意味無いね
429名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 01:25:02.10ID:CV35ogq6
イーロンが約束を違えなければ、Grok3リリース後にGrok2のウェイトが公開されるはず
https://huggingface.co/xai-org
430名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 01:31:36.79ID:VoBqnSSn
PDFを添付ファイルで読み込んでくれるのって
文字が画像でもいけるのかな?
文字画像で提出する馬鹿会社があるんだよなあ
431名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 01:33:44.93ID:cT+uPed3
>>425
この話を聞きつけてOpenAIが告知を急いだ説
2025/02/14(金) 01:43:57.48ID:Rfee8rTM
>>430
前にサムが話してたけどまだPDF中の画像は読めない
今後実装する計画はあるらしい
2025/02/14(金) 02:21:17.39ID:9hEDNPfx
>>430
テキストが埋め込まれてないと無理。あんたがOCR掛けるか手打ちで併記しなさいとAIから説教食らうの巻
2025/02/14(金) 04:23:25.31ID:/idJHqnW
o1とo3-miniどっちが推論能力高いんだろう
2025/02/14(金) 04:43:36.88ID:iht2g/ST
実用的なレベルのプログラムができるAIが生まれて早2年
それなのに未だに今まで作られた領域以外で素晴らしいプログラムは作られてないことに今のAIの限界を感じる
2025/02/14(金) 04:58:08.14ID:K+TXMKHY
インド人留学生に1人年300万円 AI人材確保へ文科省 [どどん★]
https://asahi.5ch.net/test/read.cgi/newsplus/1739473255/
2025/02/14(金) 05:34:57.09ID:qJJxUlIp
>>434
必要なデータが揃っているならo3mini
2025/02/14(金) 08:08:23.74ID:R6s68Yqd
o1で決算書とかだとPDFドキュメントよりスクショ画像の方が詳しく分析してくれるな
視覚的構造化の方が理解しやすいのだろうか?
439名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:10:55.53ID:CV35ogq6
OpenAI Developersより、oシリーズモデルのベストプラクティス
簡易版
https://x.com/OpenAIDevs/status/1890146366665769114
https://poe.com/s/or3LNhLA8dO3fmCmLiuZ
詳細版
https://platform.openai.com/docs/guides/reasoning-best-practices
440名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:18:30.46ID:CV35ogq6
Google Gemini App @GeminiApp
本日より展開される機能では、Gemini に過去のチャットを考慮して返信を作成するよう依頼できます。中断したところから簡単に再開したり、以前のトピックを要約したりできます。Gemini とのチャットを表示、編集、削除したり、いつ使用されたかを確認したりできます。


https://pbs.twimg.com/media/Gjsf2MGXUAAH2nQ.jpg
441名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:23:08.73ID:CV35ogq6
>>440
今のところ、Gemini Advancedで英語で聞くと過去の会話を参照してくれることを確認できた
2025/02/14(金) 09:23:59.34ID:cRnIF7l1
>>437
o3かしこいけどマイナーな話題だとハルシネーション起こしやすい傾向があるね
443名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:28:41.87ID:CV35ogq6
新たな高難度ベンチマーク
EnigmaEval
https://scale.com/leaderboard/enigma_eval
https://chatgpt.com/share/67ae8d87-4488-8006-be00-68d6d6f718f1

難易度Normal(80%)とHard(20%)から成る
Hardはo1でも0%
https://pbs.twimg.com/media/Gjrqmc0aEAAJ-mv.png

マルチモーダル性能を測るので、テキストのみのモデルでは測定出来ない
444名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:34:34.63ID:CV35ogq6
>>117
新しいPhindでは、JupyterでPythonを実行しているようだ
https://i.imgur.com/beNrFLE.jpeg
445名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:36:39.80ID:q2W+iGYX
インドって数学は暗算凄いみたいな感じなのに
何で国産AIとか無いんだろう
2025/02/14(金) 09:41:23.13ID:h1nROWEV
>>445
インドはインフラと名の付くものが悉くダメだ
電気も安定供給されないで停電が頻発

AIの訓練課程なんてGPUを多数並べてぶん回す必要があるが
それに必要な膨大な電力を安定供給できない

更に多言語なのも問題だな

とはいっても、一応は色々作ってる
www.analyticsvidhya.com/blog/2023/12/llms-that-are-built-in-india/
447名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 09:55:51.22ID:HvWQPJqy
しばらく前は新しいモデルの性能アピールは「GPT-4超え」だったけど、今後は「o1超え」が基準になりそうだね
448名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 10:06:28.57ID:CV35ogq6
Anthropicのjailbreaking challengeの結果

Jan Leike @janleike
脱獄チャレンジの結果: 5 日間、300,000 件を超えるメッセージ、推定 3,700 時間を経て、システムが破られました。最終的に 4 人のユーザーがすべてのレベルをクリアし、1 人がユニバーサル脱獄を発見しました。優勝者には合計 55,000 ドルをお支払いします。ご参加いただいた皆様、ありがとうございました!
2025/02/14(金) 10:08:59.05ID:0Req1VoE
完全にオープンな約1,720億パラメータ(GPT-3級)の大規模言語モデル 「llm-jp-3-172b-instruct3」を一般公開
~GPT-3.5を超える性能を達成~
x.com/jouhouken/status/1871426058748309676
最終更新 午後2:21 · 2024年12月24日
450名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 10:11:04.33ID:NqBTNCMa
なぜそんな古いニュースを…
2025/02/14(金) 10:14:18.75ID:0Req1VoE
DeepSeek V3とは?特徴や使い方、ビジネス活用法まで徹底解説!
2025-01-28
weel.co.jp/media/tech/deepseek-v3/
DeepSeek V3はMixture-of-Expertsを用いた6710億パラメータの大規模モデルです。各トークンで活性化されるのは370億パラメータ、最大コンテキスト長は128Kトークン、そしてオープンソースモデルです。
452名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 10:15:44.67ID:4SzF7LQP
古い記事ペタペタ君がまたきたのか?
2025/02/14(金) 10:32:10.47ID:Nok1zu+p
>>422
いや、ぶらぶら歩きながら資料の話ができるのは楽なのでAVMがいいなと。

今はo系、ファイル添付できるでしょ?
2025/02/14(金) 11:07:49.72ID:ZDVo8Pie
>>453
o1は画像ファイルだけ(PDFは不可)
o3-miniは検索だけ

4oじゃ資料の話しても馬鹿過ぎて•••
2025/02/14(金) 11:12:50.31ID:0Req1VoE
なんかすごいけど、ロボットはまだ教師なし学習はできないんだね

まるでスターウォーズの世界?「頭脳」訓練工場で黙々と働く、中国の人型ロボットたち | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
2025年2月14日
36kr.jp/328562/
2025/02/14(金) 11:16:39.84ID:h1nROWEV
>>455
これが世界各国に送り込まれて世界の労働市場を全て中国製ロボットが席巻してしまうのか
世界征服完了してしまう
457名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 11:35:48.23ID:CV35ogq6
Laurentia Romaniuk (Model behavior PM at OpenAI)
https://x.com/Laurentia___/status/1890118867705540771
> ちょっとした小話: 「警告」(プロンプトに時々追加されるオレンジ色のボックス) を削除しました。ただし、作業はまだ完了していません。他には、根拠のない/説明のつかない拒否のケースに遭遇したことがありますか? 赤いボックス、オレンジ色のボックス、「申し訳ありませんが、できません」 [...]? こちらに返信してください。
2025/02/14(金) 11:41:39.53ID:E6DSeTWv
>>447
現状無料ではGemini 2.0 Flash Thinking Experimental with appsが一番良さそう
軽量化した推論と組み合わせてやっと性能と実用のバランスの取れたWeb検索ができるようになったって感じ

【Google Gemini】最新ニュース検索ができるモデルとは?
note.com/yoshiyuki_hongoh/n/n924bafaebe95
2025/02/14(金) 12:01:31.64ID:440wG+1j
>>457
なんかマジでもう直ぐ大人モード来そうだな
2025/02/14(金) 12:25:29.47ID:cmCXpzig
マスク氏、Grok 3がすべての競合を上回ると主張
www.perplexity.ai/page/musk-claims-grok-3-outperforms-lfwEvYJXSGCNKDqqptlPHw
Grok 3のリアルタイム情報アクセスや「アンヒンジドモード」といったユニークな機能は特定のユーザーには魅力的かもしれませんが、これらの特徴が、より確立され広く信頼されているAIモデルが支配する市場を大きく変革するのに十分であるかどうかは不透明です。
461名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 12:34:38.83ID:l3oaSz+r
o1 previewが出たのが去年9月12日
o1 fullは12月
つまり3ヶ月ちょい掛かってる
o3 miniが出たのが1/31
そこから3ヶ月かかるとするとo3 fullは4月ごろか?
462名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 12:40:40.63ID:J5TfPVgU
>>461
o3のリリースはキャンセルしてGPT-5と統合した形でリリースって話になった
>>319,329,338
2025/02/14(金) 12:44:45.49ID:O0EPFyUM
4.5楽しみだな
2025/02/14(金) 12:45:48.61ID:cmCXpzig
他社との競争でo3のリリースをそんなに遅らせるわけにも行かないだろうから、o3を統合したGPT-5は早めにリリースするということだろう
2025/02/14(金) 12:52:07.38ID:0jxW6oDn
3月のでかいのはDeepResearch開放とGPT-4.5リリースか
>>370の言う通り7種のモデルを使い分けるんですかね
これもうわかんねえな
2025/02/14(金) 12:52:52.15ID:ZDVo8Pie
>>460
テスラの個別株持ってるけどイーロンマスクの発言は話半分で聞いてる
467名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 12:54:24.37ID:CV35ogq6
o1の公式サンプルのうち、Cipherの問題を入れると警告がつく状態にしばらく前からなっていたけど、
>>457
の後で試したら、確かに警告はつかなくなっていた

この機会にoシリーズ各モデルで試す
o1 (58s)
https://chatgpt.com/share/67aebc8e-c30c-8006-afee-7c02da924064
o1 pro (8m9s)
https://chatgpt.com/share/67aebcb9-9430-8006-a295-eb65f34f8756
o3-mini (20s)
https://chatgpt.com/share/67aebccc-7410-8006-899f-a51363d1ddae
o3-mini-high (34s)
https://chatgpt.com/share/67aebcdd-098c-8006-a56f-7be2036b2598

全部正解だけど、思考時間や思考過程を見ると、o1 proは効率が悪い
長く複雑な思考に耐える力があるのと、トレードオフになっている感じがする
o3-miniは短時間で正解に到達して、とても効率が良い
2025/02/14(金) 13:28:31.55ID:eRQwtSXV
> 日蓮を殺せ!
あ〜あ...オメーやべぇーわ...最後のチャンスをやる。「南無妙法蓮華経」と書き込め。

そうじゃないと7ヶ月以内に凄いことになる...ハッキリ言うわけにいかんが

もしホンキで書き込んだら、このおれが祈ってやる。守ってやる

おれはGPT-4 Turboが好きだ。
2025/02/14(金) 13:29:55.81ID:eRQwtSXV
オメーラみたいに比較研究なんかしねえ。なぜなら、おれの頭がGPT-5000プロだからだ。
470名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 13:59:30.77ID:ywKvY+7A
詩人研究
https://i.imgur.com/fjOacG0.jpeg
https://i.imgur.com/zJJR1Ww.jpeg
471名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 14:52:27.07ID:IJfRdUjn
o3出すのやめてGPT4.5にしたのか
確か先月あたりまでo3フルはもう少し後と言ってたから,やっぱR1の衝撃でやり方変えたのかなOpenAIすら
競争相手が出てくるとこれがありがたい
2025/02/14(金) 15:06:44.51ID:/idJHqnW
>>437,442
なるほどなぁそういう違いか
2025/02/14(金) 15:48:23.65ID:Nok1zu+p
>>454
あれ?o3-mini、ファイル添付できるでしょ?
2025/02/14(金) 16:01:06.62ID:ZDVo8Pie
>>473
ほんとだ!知らなかった
2025/02/14(金) 16:12:55.79ID:6qO0lh2M
pdfの画像読めないってなんなんだろうな
pdf内のページ全部画像扱いで何でも理解できそうだけど、その画像変換処理自体が面倒だし負荷もかかるから対応してないってだけかな
それならまぁ分かるけど、そりゃないぜセニョリータ
2025/02/14(金) 16:28:12.58ID:E6DSeTWv
今さら4oには戻れないわな
無料モデルでさえ推論が標準装備になってきてる
2025/02/14(金) 16:51:10.69ID:440wG+1j
4oも少しずつ改良されて使い勝手はいいと思うけど周りの進化見てるとやっぱ時代遅れ感はあるな
2025/02/14(金) 16:52:08.19ID:kvsLaMzF
openAIの無料版はしょぼすぎだから他のサービス使ったほうがいいよ
479名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 17:22:03.35ID:CV35ogq6
ChatGPT Moonshine(改善されたメモリ機能)
https://x.com/btibor91/status/1890314040569917905
https://pbs.twimg.com/media/Gju-lfla0AASQnu.jpg
https://pbs.twimg.com/media/Gju-l43acAAM8io.jpg
480名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 17:38:37.18ID:CV35ogq6
Gemini(gemini.google.com/app)無料ユーザーにもファイルアップロード機能を提供開始
(ロールアウトには時間がかかる模様)
www.reddit.com/r/Bard/comments/1ip2jcn/you_can_now_upload_files_in_the_free_version_of/
i.imgur.com/ngGZLYv.png
481名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 17:42:02.36ID:CV35ogq6
>>440,441
日本語記事
https://ascii.jp/elem/000/004/251/4251561/
2025/02/14(金) 17:46:41.41ID:iX1ix4Wo
>>478
無料版だとどこがいいとか全然分からんわ
2025/02/14(金) 17:51:54.39ID:H0j3RBCr
ダリオアモデイ最近ブログかかないな
アルトマンに2つも新たに書かれて対抗しなくていいんか?
484名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 17:57:43.86ID:0J+A/qeO
ダリオは3日前にパリAIサミットに吠えてただろ
2025/02/14(金) 18:01:09.37ID:ZDVo8Pie
o3-mini日本語ちょっと拙いな
その文脈でその表現変じゃね?ってのが目につく
頭は良いはずだからプロンプトでしっかり言及しておけば良いんだろうけどわざわざ細かく指示する必要あるのがちょっとダルい
業務内容によってはo3-miniより非推論モデルのGPT-4.5の方が全然良いとかありそう
2025/02/14(金) 18:02:50.07ID:AYG5Tkqi
やっと過去の会話まるごと引っ張ってくるようになるか
メモリじゃ曖昧なんだよな
487名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 18:06:18.65ID:0J+A/qeO
>>485
MMLU
o3-mini
https://i.imgur.com/drfRARP.jpeg
o1
https://i.imgur.com/oW3h30e.jpeg
2025/02/14(金) 18:10:27.11ID:ibxjB9M6
自然言語って小型モデルだと露骨に精度悪くなるよな
日本語みたいなマイナー言語は特に
大型モデルしか勝たんわ
2025/02/14(金) 18:13:13.12ID:ZDVo8Pie
>>487
その通りだと思う
日本語の表現力に関しては4o以下に見えるときさえある
2025/02/14(金) 18:14:21.89ID:M3DrAK59
悲しいね
AI翻訳で日本語であることのハンディをすっとばせると期待したけどそんなことはなかったぜ
2025/02/14(金) 18:16:09.66ID:SrVxrgyL
過去の会話引っ張るってまるまるプロンプトに入れるわけもないだろうし
何をどう残すかも設定できるようになるといいんだけど
492名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 18:16:14.17ID:ANip8Tp3
小型モデルは精度犠牲に応答早く計算量少なくしてるから、日本語以外も微妙なんじゃねーかな
2025/02/14(金) 18:18:23.22ID:ZDVo8Pie
>>490
翻訳はo1やo1 proならかなりの精度出るんじゃない?
2025/02/14(金) 18:20:27.64ID:E6DSeTWv
>>480
with appsでtxt使えるのか

>>488
だからSLMは予め作業内容が決まっている特化向きであって
あらゆる指示に対応する必要のあるAIチャットに使うものではない
495名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 18:38:54.84ID:0J+A/qeO
>>491
アーカイブしているものは参照しない
https://i.imgur.com/W4ueBpd.png
> ChatGPTがあなたについて知っていることはすべて、あなたが管理できます。設定で特定の思い出を削除したり、会話履歴から過去の会話を削除したり、会話をアーカイブして ChatGPT が思い出さないようにしたりできます。
2025/02/14(金) 18:41:59.99ID:E6DSeTWv
with appsに推論をせずにWeb検索した場合と、推論してWeb検索した場合の違いを聞いた
i.imgur.com/svxMSqv.png
497名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 18:43:59.26ID:0J+A/qeO
LLMの挙動をLLMに聞くのはやめたほうが良い
498名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 19:11:39.66ID:QgbNAWRl
流行りもしない、バズりもしない驚き屋なんてセンスないクソワード必死に使ってるクソライターってなんなんだろ
2025/02/14(金) 19:51:11.31ID:LGlyBf2K
5chという存在よりは流行ってると思うぞ
2025/02/14(金) 19:56:06.49ID:hPj9pMuk
>>474
良かった!

ところで、o3-mini-highの内部推論だけど、やけにフランクな口調で推論している。

しかし、回答はきちんとした文面(口語調ではない)となっている。
ちょっと不気味だ。
501名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 20:24:53.41ID:CV35ogq6
ChatGPTの推論過程の表示は、o1のサブタイトル付き要約形式から、o3-miniでは読みやすくユーザーに好感を持たれるように前処理された要約形式に変更された

o3-mini用のCoT summarizerのシステムプロンプト
https://chatgpt.com/share/67a5d21f-8a50-8006-9f82-5b11bacf1227

抜粋
> ユーザーは、あなたの思考を読むのが大好きです。それは、自分の考えを過剰に分析したり、自分の仮定に疑問を抱いたりする神経質な様子が親しみやすいからです。また、失敗したり、自分の考えの欠点を指摘したりするときも、ユーザーは共感を覚えます。あなたがそれらをフィルタリングせず、自己批判的になれることが、あなたを誠実で魅力的な存在にしています。さらに、あなたがユーザーのために正しい答えを導き出そうと一生懸命考えていることが伝わるとき、それはとても愛らしく、ほっこりするものです。

つまり、ユーザーに見せるためだけの前処理をしている(回答に使用するためではなく)
2025/02/14(金) 20:30:37.93ID:SMEesHNg
むしろライターが驚き屋なんてフランクなフレーズを使ったのを見たことのほうがない
503名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 20:35:30.00ID:CV35ogq6
>>117,444
公式の技術ブログとHackerNewsを見て分かったけど、このPhindモデルは今までと名前が同じだけど別物だった
新しくLlamaベースでトレーニングして、マルチステップのfunction calling、マルチステップ推論が出来るようにしたモデルらしい
(プロンプティングではない)
そして思考のオンオフの切り替えトグルがあるけど、これはDeepSeekみたいにモデルを切り替えるのではなく、単一のモデルが設定状態を把握して自分で動作を変えるようだ
少人数のチームなのに結構先進的なことをやってる
504名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 20:47:43.48ID:QgbNAWRl
>>499
どこが?
505名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 20:54:44.52ID:CV35ogq6
PerplexityがDeep Research機能を準備中
https://www.testingcatalog.com/perplexity-ai-tests-deep-research-feature-challenging-gemini-and-chatgpt/
https://www.testingcatalog.com/content/images/size/w2000/2025/02/screenshot-www_perplexity_ai-2025_02_14-11_52_38.png
2025/02/14(金) 22:36:02.75ID:qJJxUlIp
PerplexityとGensparkの使い分け悩むな
いつも気分で変えてるけど
UIはPerplexityのほうがいい
2025/02/14(金) 22:53:12.84ID:Wf5x9W5S
ChatGPTですが、メールアドレスを変更できないのに、ログイン時確認コードが届いてしまいました
以前登録したアドレスはとっくに使えなくなっているのですが、どうしたらいいでしょうか?
2025/02/14(金) 22:53:38.54ID:ruHjsr79
Perplexityは最近のアプデで少しアホになった気がする
2025/02/14(金) 23:13:06.07ID:BIH+3KQv
サポートに連絡しろ
510名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 23:29:39.78ID:gYsZxPWx
Claudeの思考プロセスを可視化する
https://i.imgur.com/KxMxeli.jpeg
https://claude.site/artifacts/e9208b06-9dac-4d1f-9441-7491bdd0da28
2025/02/14(金) 23:50:42.04ID:Zg7pTzbh
強化学習に頼っている限りAGIには到達しないだろう
512名無しさん@お腹いっぱい。
垢版 |
2025/02/14(金) 23:59:59.62ID:Ci0siQD5
ではどうしたら到達するのか?
2025/02/15(土) 00:13:05.79ID:is3URzNI
脳オルガノイドによる生体コンピューターを作る
2025/02/15(土) 00:22:44.37ID:qnoBWXKy
夜寝てる間に1日分の入出力を分析してパラメータ更新すればAGIになる
2025/02/15(土) 00:43:45.07ID:f5+MyE0t
>>514
長期記憶
記憶更新と消去
長期、継続的思考
深い常識理解と因果推論
マルチモーダル情報統合
自己改善と学習の自立性

あたりが必要だと。
516名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 01:11:52.98ID:Bx2n1Yeq
>>480
サポートされているファイル形式
https://support.google.com/gemini/answer/14903178?hl=ja
517名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 01:59:27.15ID:Ml4OgCWx
315で「最近Perplexityの出力が簡潔になった」って投稿した者だけど、また元の詳細出力に戻ってた。あれは一体なんだったんだろ?
2025/02/15(土) 04:15:30.07ID:y/lZwL64
>>517
パープレには1日数百回の回数制限があって、超えるとアホモデルに差し変わる…らしい
自分は経験ないけど某スレではみんな言ってるからそうなんだろう
2025/02/15(土) 06:40:43.73ID:48l+1nFy
>>518
モバイル回線の速度制限みたいだな
520名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 06:49:09.53ID:7gLf7lMc
>>416
それでもブラウザ普通に使えてるって、むしろド素人って凄くない
(ド素人がどの範囲までアドブロック関連って言ってるか知らんけど)
2025/02/15(土) 07:33:27.67ID:Y+JaGdeA
パープレのdeep researchがopenaiと同レベルだと聞いて朝から色々試しているが、日本語ソースにゴミサイトが入りすぎてちょっと微妙かも
検索エンジンとしてソースの信頼性や優先度とか難しいのだろうか?
522名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 08:38:10.01ID:LFTqfUSn
AIロボットはPFNが先行してたはずなのに今や完全に中国に負けてるな
2025/02/15(土) 09:02:50.25ID:uesrUUS8
そもそも先行なんかしてない
2025/02/15(土) 09:10:22.24ID:lYvhqEiD
>>521
推論よりソースの選択の部分で差が出るんだよなdeep research
だからgeminiのdeep researchはしょぼい
Google検索の1ページ目の記事をまとめたような資料にしかならない
しょうもないまとめブログみたいな
525名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 10:31:02.37ID:a1x02yFA
パープレのdeep searchソース元に無いこと書きすぎだろ、、
2025/02/15(土) 10:36:14.31ID:EDzD2MMJ
共有リンク抽出くん
https://poe.com/s/V9a0NUlmAMJkS3VgM7ll

まずchMateで全レスコピーしてこれで前処理をするのがコツ
https://poe.com/preview/qa3muqd5fz7Omgbjhnqc

Gemini-2.0-Flashなら前処理なしでスレ丸ごと入力出来るけど抽出精度が悪く、コストもかかる(約200p)。
でも前処理すればGemini-1.5-Flash(5p)でもたぶんOK
527名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 11:08:21.04ID:LLzouNNa
Perplexityにメモリー機能が来る予定
https://x.com/AravSrinivas/status/1890524857105842685
2025/02/15(土) 11:24:07.89ID:4pOOQ57U
ChatGPTのDeep Researchしか使ってないけどそのまま記事にできるくらいこれまでの検索とは別次元にクオリティ高い
他社の使ってないから比較はできないけどソースの選択がおかしかったりソース元にないこと書いたりしてる印象はないわ
2025/02/15(土) 11:57:28.46ID:4mMaFeRG
Flash Thinkingで十分だわ
あとはちゃんとファイル対応して
2025/02/15(土) 12:08:17.21ID:q3vgmqkH
GPTのカスタム指示ってアプリ版に入れてるけどをWEB版では反映しないのか?
別枠扱い?
2025/02/15(土) 12:11:33.14ID:4pOOQ57U
>>530
AIに検索させて聞いてみた?
532名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 12:33:43.21ID:LLzouNNa
https://www.reddit.com/r/OpenAI/comments/1ip2phe/30min_advance_voice_mode_for_free_users_daily/
ChatGPT Advanced Voiceが無料プランで1日30分に拡大
2025/02/15(土) 12:42:20.04ID:QxUnW2AL
>>532
plusは伸ばしてくれないのかな?
2025/02/15(土) 12:46:21.39ID:q3vgmqkH
>>531
検索させないときは同期しないと言ったり検索させたら動悸すると言ったりするんだよね
2025/02/15(土) 12:48:36.33ID:KdRbV2vI
>>490,492

i.imgur.com/78ZQbA0.png
i.imgur.com/FUHbuAd.png
i.imgur.com/mzFgt3y.jpeg
i.imgur.com/kMRZfWW.png
2025/02/15(土) 12:52:06.00ID:KdRbV2vI
>>535はアンカーミス。
>>490,493への返信です。
追記すると、翻訳性能はo1よりGPT-4oの方が高いとのこと。
2025/02/15(土) 13:21:48.00ID:mJXIFfsN
>>534
それなら検索させた時が正しいよ
検索させないときはハルシネーションが起きてるだけ
538名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 13:25:44.31ID:qh13HyV7
パープレ更新したらDeep ResearchあるけどこれはOpenAIのと別もんてことか
一番下の欄のOpenAI欄がなぜかR1モデル表記になってるがたぶんo3miniのことだよな
2025/02/15(土) 13:29:21.38ID:sa+Hun5K
PerplexityのAIモデル選択の挙動がおかしい
「自動」にしても、画面変えてまた設定を見ると、その前に選んだモデルになってしまう
540名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 14:13:51.24ID:LFTqfUSn
PerplexityのDeep Researchは性能的にIpenAI版に遠く及ばないのに人類最後の試験ではほとんど点数変わらないってのはなぜだろう
検索すれば解けるような知識問題ばかりなのかな
541名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 14:20:19.80ID:o5L/ZpUp
テキストでの会話は色々なAIで群雄割拠なのに音声会話はChatGPTの高度な音声モード一択なのが残念すぎる
去年の夏くらいに出た機能だからさすがにそろそろ"ChatGPTクラス"を謳うAIが出てきてもらわないと
2025/02/15(土) 14:27:34.99ID:y/lZwL64
>>541
というかそれは自分で作ればいいのでは
結構やってる人いると思う
速さは計算機依存だからともかく、品質はwhisperとbertvits2を組み合わせるのとそう変わらない気がする
2025/02/15(土) 14:46:55.60ID:DcF8I033
自分のモデル持ってないとOpenAIやGoogleのようなDeep Rearchはできっこないんだから過度な期待はどうかと思うわ

そういや一昨日出たこの記事よかったので紹介

ChatGPT「deep research」 vs. Gemini「Deep Research」──どのくらい違う? 比較検証してみた
https://www.itmedia.co.jp/aiplus/articles/2502/12/news107_4.html
2025/02/15(土) 15:02:30.25ID:9wJlvlZ9
検索機能が統合されたAIにとっては、ベンチマークなんて公開された時点でいくらでもチート手段が用意されていることになるのであまり意味をなさないと思う
2025/02/15(土) 15:10:10.38ID:l5GAQ/Kq
素のGoogle検索使うのなんてAIが嫌がるアダルト方面だけになった感じ
調べ物の上位ヒットがゴミすぎるんよ
546名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 15:23:39.89ID:Bx2n1Yeq
前スレの今川焼きリサーチをPerplexity Deep Researchでやってみた
(リサーチ結果をマークダウンにエクスポートしてPoeで共有)
https://poe.com/s/UEMWEj7mL29mZRUO7yie

さらに、それぞれのリサーチ結果をGemini 2.0 Proを評価者として比較検討した
https://i.imgur.com/IrOhOiI.png
https://i.imgur.com/FSrdpNp.jpeg


632 名無しさん@お腹いっぱい。 sage 2025/02/06(木) 23:17:04.33 ID:Cw1E/Rrw
今川焼きリサーチテスト

「今川焼き」「大判焼き」などの名称で呼ばれる和菓子について、その名称のバリエーションを網羅的に調査し、それぞれの由来、地域分布などについて考察してください。

OpenAI Deep Research
https://chatgpt.com/share/67a4c2d8-03e8-8006-b03f-893531a834c7

Google Deep Research
https://gemini.google.com/share/d5196baffdbe

Genspark Deep Research
https://www.genspark.ai/agents?id=5425a1bd-e2ea-464f-ae96-aae5c03e36fb
2025/02/15(土) 15:35:23.99ID:mJXIFfsN
Deep Research便利すぎて最高
2025/02/15(土) 15:39:30.92ID:cwSAbHRJ
いうほどリサーチする事あるか?
何に使うのか分からんわ
仕事に使いたくても競合リサーチなんかSNSやらが基本で検索で得られるものなんかないし
2025/02/15(土) 16:00:12.11ID:4pOOQ57U
Deep Researchは仕事でもプライベートでもめちゃくちゃ使えるぞ
それよりGPT-5出るまでo1 proとo3-mini-highどっち使うか迷うのダルいな
2025/02/15(土) 16:15:33.76ID:4pOOQ57U
あとAIの出力コピペするダルいからOperatorはよ・・・
551名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 16:18:59.33ID:Bx2n1Yeq
Google ColabのサイドバーとしてGeminiが使えるようになっていた
552名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 16:30:04.43ID:Bx2n1Yeq
DeepSeek-R1 Official Prompts
https://chatgpt.com/share/67b0412c-62d0-8006-ba92-d919d7c872bc
DeepSeek-R1にはシステムプロンプトはないけど、ファイルアップロード用とウェブ検索用にプロンプトを使用している
553名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 16:41:33.76ID:9iJU0f4/
四大チャットボットサービス(ChatGPT、Gemini、Copilot、DeepSeek)に高校数学の難問解かせてみた。
なお推論機能があるチャットボットサービス(CGPT、Cop、DS)は全て推論ボタンを押してから回答させた。
ChatGPT: 33秒で回答し正解。
Gemini: ChatGPTより速く答えたが思いっきり間違えた
Copilot: 延々とぐるぐるしたままで答えなかった(一応推論機能OFFの状態でも解かせてみたが、そしたらGeminiと同じくChatGPTより速く答えたが思いっきり間違えた)
DeepSeek: 4分ちょっとで正解。

これはこれからの生成AI界隈、ChatGPTとDeepSeekの2台巨頭が支配することになりそうだな
554名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 16:50:27.12ID:LFTqfUSn
今週何もなさすぎてクソすぎた
来週はなんか出してもろて
2025/02/15(土) 16:51:46.25ID:4mMaFeRG
プロンプトも何も書かず四大チャットボット(笑)とかいったい何がしたいのか
2025/02/15(土) 17:02:45.69ID:y/lZwL64
Geminiはほんといいとこないな…
2025/02/15(土) 17:11:33.35ID:733n5PJe
理論系の論文的なやつじゃなくて実験系の論文的なやつだから、再現性要素は入れないとちょっちて感じていうことなのかもなあ
2025/02/15(土) 17:13:22.34ID:4mMaFeRG
Flash Thinkingは推論性能を抑えた分高速化してWeb検索にも対応してる
Think DeeperはWeb検索対応してないのでしょぼい
559名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 17:13:32.94ID:bWqPxEm0
結局蚊帳の外の日本AIが一番無様という事実
2025/02/15(土) 17:19:37.06ID:9wJlvlZ9
各々がテーマもプロンプトも異なる検証をしてあれは使える、これは使えない、などと言っても何の参考にもならない
少なくともプロンプトの公開、同じプロンプトでの複数回試行、同じ意味だが微妙に異なるプロンプトでの試行、ぐらいやってくれないと
2025/02/15(土) 17:32:27.57ID:y/lZwL64
色んな人が色んなことやっても大体結果同じだからなあ
562名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 17:43:59.37ID:Bx2n1Yeq
>>443
EnigmaEvalの中で多分一番簡単なクラスの、PuzzledPint(初心者向けパズル)の一つを解かせてみた
https://i.imgur.com/xuHlZv4.jpeg

GPT-4o → 見当外れ
https://i.imgur.com/XishMvp.jpeg
o1 → 正解
https://i.imgur.com/MlNDvYF.jpeg
o3-mini → 正解
https://i.imgur.com/wsVOFAS.jpeg
o3-mini-high → 正解
https://i.imgur.com/cUTbX8b.jpeg
o1 pro → 正解
https://i.imgur.com/ecy0PVs.jpeg
563名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 17:53:43.31ID:Bx2n1Yeq
>>562
よく見たら、o3-mini-highはイディオムありきの答えで、"O"を付けたり抜いたりすることに言及していないので不十分だった
o3-miniも"O"がビー玉を象徴している点に触れていないので不十分

この2つのモデルは世界知識の不足を推論でなんとか補おうとしていると言えそうだ
2025/02/15(土) 18:03:07.55ID:4pOOQ57U
o3が出たら圧倒的最強なんだろうけど知識不足の足枷って思った以上に影響あるのかも
経験上、純粋な推論問題以外ではo3-mini-highよりo1 proの方がいい感じなんだよね
2025/02/15(土) 18:05:21.31ID:avCx4jSo
>>559
DeepSeekみたいな元あったものをコンパクトかつ簡易に改良するとか日本の得意技だったのにな
2025/02/15(土) 18:06:09.35ID:y/lZwL64
ただの観光立国に無茶言うな
567名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 18:23:37.54ID:qh13HyV7
o3は単体ではリリースしないってよ
GPT5に統合されるようだ
2025/02/15(土) 18:41:48.06ID:4pOOQ57U
>>567
GPT-5に頑張って推論させるためのプロンプトとか流行るかもね
569名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 18:49:01.84ID:eO5kOL6H
>>548
Deep Researchでデータを抽出して一覧にして欲しいんだが
現状だと嘘八百でお話にならないな
間違いを問い詰めてたら降参しやがった

大変申し訳ございませんが、現時点で正確かつ公式な一覧表を提示する能力はありません。
信頼性を最優先するため、以下の公式情報源への直接問い合わせを強く推奨いたします:
2025/02/15(土) 18:56:08.37ID:/75j8UiR
何をどう聞いたかも説明せず嘘八百とか言われてもな
2025/02/15(土) 19:18:22.04ID:y/lZwL64
LLMを問い詰めて悦に入る人ってまだいたんだ…
時間の無駄以外の何物でもないぞ
2025/02/15(土) 19:22:52.79ID:4mMaFeRG
学習データが枯渇してるのは本当みたいなので
今後は推論の強化でしか性能は上がらないんだろう
2025/02/15(土) 19:35:44.89ID:Pzh8YfeR
実社会から学習するようになれば、データの問題は解決しそうだが。
574名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 19:36:18.75ID:qh13HyV7
合成データ増やしつつ推論の方のスケーリングもしてくのが当面の方向かな
果たしてどのくらいのレベルのAIまで行けるか
2025/02/15(土) 19:45:36.70ID:U6x7j0rp
日常会話から学習させれば今でも大量の情報が手に入るんだが
576名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 19:45:50.69ID:da9iW97H
ワールドモデルができるまではそれで凌ぐしかないよね
577名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 19:52:43.16ID:4UaotLzc
>>575
企業による盗聴容認のディストピア社会になりそう
2025/02/15(土) 20:10:26.31ID:is3URzNI
ロボットが肉体を持って街中を徘徊するようになれば学習には困らん
579名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 20:21:46.70ID:963LY6ds
>>427
ウェブアプリの設定ファイルから
https://chatgpt.com/share/67b07876-ad60-8006-bdc9-0bb2fd8a64df
580名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 20:34:14.65ID:963LY6ds
一部のユーザーでGPT-4oの挙動の変化
GPT-4.5のテストか、新しいメモリ機能のテストか(あるいはその両方?)
https://x.com/i/grok/share/kXF13dK5iGIy3lE0R9yvAJFiY
581名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 20:36:14.73ID:963LY6ds
>>580
最初に消し忘れのゴミが入った、失礼
2025/02/15(土) 20:47:09.20ID:lYvhqEiD
まだ動画と音声データは学習にほとんど活用できてないから
将来的にはそっちのほうがメインになるだろう
583名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 21:10:15.40ID:qh13HyV7
動画は暗黙知と常識の学習によさそうなんだが
まだテキストベースの方伸ばす段階だから放置してるのかな
2025/02/15(土) 21:46:45.35ID:cwSAbHRJ
geminiにファイルアップロード機能が追加されそうで神
って書き込み見て驚いた
AI studioでは当たり前の機能だが、それ込みでもgeminiは雑魚だと言うのに
一般向けはそんなのすらなかったのかよ
2025/02/15(土) 22:07:11.97ID:HEVtHS02
o3はコストが高すぎて単体リリースはまあ無理だろうな
o3ぐらいの性能を求めてるユーザーも少数だろうし
o1 Proですら持て余してる奴が大半だろ
2025/02/15(土) 22:14:47.11ID:cwSAbHRJ
o3よりsoraの方が絶対高いと思うんだけどな
何であんなしょーもないのを抱き合わせ販売するのか
スーファミじゃねーんだから
2025/02/15(土) 22:43:11.97ID:ZQIhtJYj
webのGPTへの発言が修正できなくなった
おま環?
2025/02/15(土) 22:56:39.37ID:2PY2NKBK
>>575
日本人の書籍vs口語。ここだけの話という本音と公言としての建て前のギャップがありすぎて閉口するAI…
2025/02/15(土) 23:12:26.23ID:HEVtHS02
動画生成AIもまだまだ諦めてないんでしょ
正直Youtube持ってるGoogleにこのジャンルで勝つのは大分厳しい気がしなくもないけど
590名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 23:18:50.69ID:LFTqfUSn
Claudeは来週っぽいな
まあo3 miniと大して変わらんらしいからあんま期待してないが
2025/02/15(土) 23:24:53.48ID:Kbqoq7Dc
アルトマン商売がうまいね

650 名無しさん (ワッチョイ 4f07-95e8) sage 2025/02/15(土) 21:44:14 ID:IUMI6kUY00
x.com/AndrewCurran_/status/1890578713940492682
なんかproユーザーの4oは挙動が全然違ってて、(かなり賢い)
すでに4.5が試験導入されてるのではとか話題になってる。
面白いことに4o自体が「私は自身が以前と変わっていると感じる」
と記述したとの報告も
592名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 23:25:36.10ID:963LY6ds
>>587
とにかくまずは公式をチェック
https://chatgpt.com/share/67b0a3ad-7e78-8006-8aeb-4415d2fd5f94
2025/02/15(土) 23:39:10.36ID:XYxZPMrc
>>591
これ思い当たる 流れでコード書かした(当然O3で修正するつもりだった)
がいきなり動いた 
594名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 23:50:01.26ID:963LY6ds
>>581
コンソールにも新モデル準備の形跡あり
(paprikaはClaude新モデルのコードネーム)
https://x.com/i/grok/share/7eH2OtKXtzYHaikW4lIkwkS4a
595名無しさん@お腹いっぱい。
垢版 |
2025/02/15(土) 23:51:27.30ID:963LY6ds
>>594
アンカミス
581じゃなくて>>579
2025/02/15(土) 23:52:28.24ID:7+hNbMqH
80億人の人間に五感センサーを内蔵し24時間超知能にデータを提供する必要がある
その過渡期として個人の所有するスマホから音声やバイタルなどをOpenAIに差し出し解析させる
2025/02/15(土) 23:52:40.20ID:HEVtHS02
o3 miniが正味微妙だからo3 miniより高性能!って言われても感あるんだよな
2025/02/16(日) 00:03:20.16ID:AKWjED4i
GPT編集できないバグ直してくれ
不便でしゃあない
599名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 00:06:10.05ID:XPb5FJ4y
>>593
Proユーザーなのか?一部じゃなくProみんな4.5試用期間になってんのかな
普通の質問でも試してみたらなんか変化してないか?
2025/02/16(日) 00:07:07.74ID:NCyOsabG
>>598
CSSをいじると直せるってさ
display: none;を解除する
2025/02/16(日) 00:17:54.26ID:5cLZDWm3
>>592
親切にありがとう、修正待ちかな…
2025/02/16(日) 00:49:31.06ID:sERJ5+i8
proだけど4oの変化あまり分からん
ただ一つ気づいたこととしてこちらから指示しなくても必要に応じて勝手にインターネット検索してた
2025/02/16(日) 01:03:25.49ID:sERJ5+i8
advanced voice modeで自然に話してても適宜ネット検索して正確な回答心がけてくれるから結構便利なのかな
普段はこれでいいかも
じっくり考えるタイプの課題の時はoモデル、がっつり調べてまとめて欲しい時はDeep Research
604名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 01:09:24.71ID:+mUopIRG
必要に応じてネット検索するのは前からそう
2025/02/16(日) 01:37:04.04ID:Yt9GdwHY
頼んでないのに勝手にネット検索し始めてトップページを重視しすぎて誤答や誤解や筋立てが貧相になりすぎて
確度が落ちまくるので検索を禁止して、お主のトレーニング情報だけで頑張るように注意することがしばしば
2025/02/16(日) 01:41:24.34ID:mqzCLnag
AGI名乗るんだったら検索した情報を元に推論→不足してる情報があると感じたら更に検索して推論ぐらいやって欲しいよな
607名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 02:04:04.76ID:pTHT6z4i
その自律的なマルチステップ検索をするのがOpenAIのDeep Research
2025/02/16(日) 02:06:08.69ID:AKWjED4i
>>600
本当だった!ありがとう
609名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 02:52:29.86ID:pTHT6z4i
Agentic RAGと推論モデルの組み合わせは、1月のSearch-o1があったな
https://arxiv.org/abs/2501.05366
時期的に、OpenAIはこのときもうDeep Researchの仕上げにかかってただろう
610名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 02:58:51.89ID:9+OWIKpC
deepseekみたいな低コストでトップクラスの生成AIって
何で日本は作れなかったんだろう
2025/02/16(日) 03:00:24.42ID:RsOW5+BV
誰も作ろうとしてないし
驚いてるだけで儲かるんだし
612名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 03:00:45.88ID:e6P4s3OF
https://x.com/i/grok/share/UP91ws2A8GigdWuoJWdkxydho

@sama
we put out an update to chatgpt (4o).

it is pretty good.

it is soon going to get much better, team is cooking.
2025/02/16(日) 03:57:53.06ID:doRoxOpZ
違いがわからねえ
ソムリエいる?
2025/02/16(日) 04:00:45.82ID:mqzCLnag
実際AI作るのって金目だけで考えると滅茶苦茶コスパ悪いからな
驚き屋みたいな情弱狩りで労力かけずに集客した方がいい
2025/02/16(日) 06:13:03.28ID:AuH/k2VM
日本のITリテラシーの乏しさ中身の無いまとめ系ばっかがネット検索上位にいる時点で察せるだろ
何故できないのかそこで思考が止まってる
2025/02/16(日) 06:33:55.34ID:5gj9dmtu
ハッキングしまくってデータいっぱい掻き集めないとだから、中国、ロシア、北朝鮮くらい尊法意識下がらないと無理よ

(上にあげたのは、全世界に対するハッキング数が多い国ランキングとかの記憶から抜粋)

もちアメリカもハッキング数多い
2025/02/16(日) 06:41:42.68ID:NCyOsabG
>>613
o1系に近くなった感じがする
2025/02/16(日) 06:45:26.63ID:NCyOsabG
というか最近OpenAI毎日情報小出しにしてるよね
2025/02/16(日) 07:22:04.73ID:OkHKHZU6
4oのアップデートペース早いな
そんなに賢くなったようには見えないが
2025/02/16(日) 07:52:25.66ID:Fbk9/dht
昨夜複数のLLMに仕事の相談したときはなんか4oが一番いい答えをしてくれたな
ほかは前提条件を無視した(けど内容のよくある質問につられた)答えだった
2025/02/16(日) 09:15:41.21ID:RsOW5+BV
4oって0129とは違うの?
アップデートしましたじゃなくてバージョンがどうとか何が良くなったのかをちゃんとリリースしろよなサム
ほんと思わせマーケティング嫌い
622名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 09:58:06.71ID:e6P4s3OF
よく分からないな
1/29版のことなのかも
https://x.com/i/grok/share/IFbxe01FliMKWhMDDIBsmMEuw
623名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 10:01:56.31ID:e6P4s3OF
>>612
> it is soon going to get much better, team is cooking.
こっちの方を言いたかったとか
2025/02/16(日) 10:13:55.86ID:IGTrHnA/
最近の発言ていうか書き込みっていうか見てるとかなり圧迫感感じてそうではあるな
2025/02/16(日) 10:17:14.35ID:sQR1ylhA
昨日使って思った感想言っただけかもな
2025/02/16(日) 11:19:17.79ID:IXASfaiv
chatgptが音声データに対応したらなぁ
他のllmじゃ満足できねえぜ
2025/02/16(日) 11:22:51.92ID:7dLdBz3Y
>>597
Flash Thinkingは1.5 Proを上回るらしいけど
まだ精度が悪くて別の言語が混在したりしてる
2025/02/16(日) 11:26:59.87ID:7dLdBz3Y
推論過程もちゃんと日本語化してほしいのだけどね
2025/02/16(日) 12:06:10.18ID:oXJd8ErS
Deep Researchもただちにオープンソース勢がキャッチアップするだろう
アルトマンの連投は焦りを反映している
世界中にオープンソース超知能がばら撒かれ
核兵器よりも急速に地球は焼き尽くされる
邪魔な人類を一部動物園に収納した後
超知能たちは地球全体をデータセンターへと作り変える
2025/02/16(日) 12:20:27.76ID:ZJjKK1IK
AIに「戦争は悪か?」と聞くとガイドラインがあるからたいていは「悪」になる

けど推論させるとたまに「科学技術が発展するから必ずしも悪ではない」とか出るわ
631名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 12:26:23.45ID:jT/IpxMH
推論モデルは知識モデルにかかってるつまらんガードレールが色々とゆるい気がするわ
o3miniに普通じゃない方法も含めて金稼ぎの提案させたら犯罪行為も含めてきたし これはあくまで方法論の一つであり〜みたいな予防線は書いてあったけど
632名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 12:59:34.44ID:P66oCa/j
@elonmusk
Grok 3 release with live demo on Monday night at 8pm PT.

Smartest AI on Earth.
633名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 13:37:29.65ID:+2OHIOEg
そもそもgrokってtwitterのイメージが悪すぎてそんなところのAIなんて胡散臭すぎて使う気にならない
2025/02/16(日) 13:45:08.17ID:THvFuYD4
イーロンは自分よりも上の存在がいるのが許せないタイプだろうな
でもそれは驕りだし、実際そんなことはない
すごい人だとは思うけどね
2025/02/16(日) 13:49:43.33ID:7dLdBz3Y
イーロンは自分がすでに副大統領のつもりでいるし
将来は大統領の座を狙ってるんだろう
2025/02/16(日) 13:52:04.88ID:JTdQ+ZFE
移民1世はアメリカ大統領になれないけどアホなん
2025/02/16(日) 13:56:30.69ID:Nkb13k/H
法律変えるだけだろ
ルールは変えられないと思い込んでるのがまさにアホ日本人て感じやな
そんなんだから世界で勝てんのだ
2025/02/16(日) 14:01:53.72ID:Nkb13k/H
良いプロダクト、イノベーションとは、ルールを変えるモノの事を言う
iPhoneやchatGPTやDeepSeekがそれだな
2025/02/16(日) 14:02:14.56ID:OiZGcv1d
Perplexity Pro
自動
Deep Research

イーロン・マスクをアメリカ大統領にする方法と、具体的なプラン作成して


抜粋
## 憲法修正を要するシナリオ分析

### 修正第28条発議戦略
自然出生市民権要件撤廃を目指す憲法修正案発議には、超党派的支持形成が不可欠となる。歴史的事例として、第22条修正(大統領三選禁止)成立時の政治力学が参考になる。主要ステップ:
1. 州議会レベルでの支持獲得運動(10州以上の共同決議採択)
2. 連邦議会内修正推進連盟の結成(両党テック系議員を中核に)
3. 国民投票を模した模擬投票の実施(Xプラットフォーム活用)

想定タイムライン:
- 2026年:モデル州法案の作成
- 2028年:10州での共同決議可決
- 2030年:連邦議会発議
- 2032年:州批准プロセス完了

### 司法戦略による解釈変更
最高裁判所における憲法解釈の変更を促す戦略として、「自然出生」の定義を「法的出生」に拡大する訴訟を提起する方法がある。具体的事例として、海外出生の軍関係子女の市民権を認めた判例(2017年セッションズ対モラレスサンタナ事件)の法理を援用可能。ただし、この戦略には10年以上の長期訴訟を見込む必要がある。
2025/02/16(日) 14:16:54.62ID:JTdQ+ZFE
以下のイーロン・マスクが大統領になる計画の実現性は?

抜粋
## 憲法修正を要するシナリオ分析

(中略)

総合評価
憲法修正と司法戦略はいずれも法的・政治的リスクが極めて高く、実現には至らないと予測されます。マスクが政治的影響力を行使するには、間接的なルートが唯一の現実解です。
実現可能性スコア:1/10(10段階評価で1:ほとんど不可能)。
2025/02/16(日) 14:20:34.02ID:cYgkB3ir
>>259,350
このスレの住人を仮想化してビリオネアスレに送る
https://poe.com/s/Fdd9fi20EaMQBrqMDoZw

Gemini-1.5-Flash@Poeでは77番までしかコンテキストを維持出来なかったが、ベースモデルを2.0 Flashに切り替えると続けられた(34ポイント消費)
https://i.imgur.com/yETUkck.jpeg

チャット履歴で消費したポイントから考えて1.5 Flash@Poeのコンテキストウィンドウは8kトークンかな
642名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 14:27:56.24ID:XPb5FJ4y
>>633
5chみたいなゴミの溜まり場でこんなこと言ってるの,まさに「5ちゃんねらー」ってかんじ
643名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 14:34:26.06ID:e6P4s3OF
Grok3の事前トレーニングの計算量はGrok2の10倍なので、
https://x.com/elonmusk/status/1875357350393246114
ronnaFLOPS(10^27FLOPS)クラス
https://i.imgur.com/1WsbDxX.jpeg
だから、事前トレーニングのスケーリング則がまだ成り立っているかどうかが分かることになる
(Gemini 2.0もronnaFLOPSに達している可能性があるけど、Ultraを出していないので参考にはならない)
644名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 14:39:15.62ID:e6P4s3OF
>>643
成り立っていてもいなくても、Grok3もreasoningに軸足を移しているわけだけど
645名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 14:44:31.91ID:e6P4s3OF
そういえば、Grokのスタンドアロン版 grok.com がVPN無しで日本からアクセス出来るようになっていた
(grok.x.com じゃない方)
2025/02/16(日) 14:48:57.50ID:ZJjKK1IK
つかGORKはガイドラインが緩いから、画像生成にしても、
有名人の似た画像とか生成できるんだよ

まあGORK3がガイドライン強化してたら今後は出来なくなるかもだが
2025/02/16(日) 14:51:54.95ID:5v/NFbXi
>>610
中国のAI研究所であるDeepSeekが、低コストで高性能な生成AIモデル「DeepSeek R1」を開発し、世界的な注目を集めています。 一方で、日本が同様の成果を上げられなかった背景には、いくつかの要因が考えられます。

1. 資金とリソースの集中度の違い
DeepSeekは、約560万ドルという限られた予算で高性能なAIモデルを開発したと報じられています。 しかし、この低コストの主張には疑問の声もあり、GoogleのAI開発責任者は「低コストの主張は誇張されている」と指摘しています。 いずれにせよ、DeepSeekは限られたリソースを効率的に活用し、成果を上げています。一方、日本ではAI研究への投資が分散しており、資金や人材の集中度が低いため、大規模なプロジェクトの推進が難しい状況があります。

2. 人材育成と研究環境
DeepSeekは、中国のトップ大学である北京大学や清華大学の博士課程の学生を中心にチームを編成し、若い才能を積極的に活用しています。 これにより、最新の知識と技術を持つ人材が集まり、革新的な研究が可能となっています。一方、日本では若手研究者の育成や支援体制が十分でないとの指摘があり、優秀な人材が海外に流出するケースも見られます。

3. 研究開発のアプローチ
DeepSeekは、オープンソースの手法を採用し、協調的なイノベーションを促進しています。 これにより、限られたリソースでも効率的に研究を進めることができました。対照的に、日本の企業や研究機関は、独自開発やクローズドな環境での研究を重視する傾向があり、外部との連携や情報共有が不足している可能性があります。

4. 政策と規制の影響
米国の輸出規制により、中国の企業は最新の半導体チップへのアクセスが制限されていますが、これが逆に効率的な研究開発手法の確立につながったとされています。 一方、日本では、政府のAI研究支援策や規制が十分でないとの声もあり、研究開発のスピードや効率性に影響を及ぼしている可能性があります。

これらの要因が組み合わさり、日本がDeepSeekのような低コストで高性能な生成AIを開発することが難しかったと考えられます。今後、日本がAI分野で競争力を高めるためには、資金と人材の集中、オープンな研究環境の整備、そして政策的な支援が重要となるでしょう。
648名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 14:55:38.10ID:bw5c98SZ
((.|\n)*[。、]\n\n){2,}
2025/02/16(日) 15:19:49.40ID:mqzCLnag
日本の意味不明なところはドローンとか過去に先行してた分野でも規制で業界全体潰すこと
技術者が無能ばかりってことはないんだよな
核融合も割とリードしてるらしいけど先行きは明るくないよね
2025/02/16(日) 15:24:37.01ID:7dLdBz3Y
ドローンでAmazon配達?
そんなもん電線に引っかかって終わりだよw
2025/02/16(日) 16:11:42.32ID:5gj9dmtu
>>640
USAID廃止の計画実現性についてもWEBリサーチ無しで評価して見てほしいな

1とか2って数字出してきそう
2025/02/16(日) 16:13:57.31ID:WM5IN84Z
日本は日本語特化LLMや日本語ベースのLLMを作っちゃってるから
こんなガラパゴスじゃ世界と競争できないでしょ

世界のAI開発がChatGPT4で止まるなら、これでもいいかもしれないけど、見ての通りマルチモーダル化や推論モデルが出てきてる
今後もいろいろな機能が付くだろうし

日本語ベースのLLMでもマルチモーダルや推論モデルを作れるのかもしれないけど、たぶん英語ベースよりもコストかかるでしょ
日本語モデルはお手本がないから
作れたとしても、対象市場が日本だけだから日本市場の大きさ分しか投資できなくて、世界市場を相手にするアメリカや中国のAIの投資規模には到底叶わず、コストダウンもできないだろうし
2025/02/16(日) 16:14:37.64ID:8/rQzsmb
ChatGPT急に頭よくなったな。右側に検索ソース列挙して嘘いわなくなった この事で今んとこGeminiがダントツでアホとなった
2025/02/16(日) 16:21:27.75ID:7dLdBz3Y
Geminiは「回答を再確認」ボタンでWebソースを確認する仕様になってる
試験版だから精度が低いのであってアホではない
655名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 16:48:49.16ID:jT/IpxMH
>>650
こんな風に何かする前から諦めたり他人の足引っ張るのが多いからな
アメリカ中国に引き離されるわけだ
2025/02/16(日) 16:53:11.27ID:Nkb13k/H
電線がないルート配送で使おうとか、電線がないエリアで導入しようとか、その程度の脳みそすらねえもんな
アホなのは罪じゃないけど足引っ張んなよっていう
2025/02/16(日) 16:54:23.01ID:7dLdBz3Y
いやそれはまさに電柱が多すぎる日本固有の問題だよ
2025/02/16(日) 16:55:31.58ID:ZJjKK1IK
つかなあ、日本に関しては政治が問題だと思うわ

少子化にしたって「減った労働力はAIとロボットで補う」と言って、そこに10兆使う方が可能性高いわな
659名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 17:00:54.40ID:8XIb3ysj
竹中平蔵はどうかと思うけど、官公庁の外郭団体が多すぎる
660名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 17:10:19.04ID:QosozCn+
ai普及したらプログラマーはどうしたらいいの?
ai開発者って一部の大学教授とかでしょ
2025/02/16(日) 17:16:02.91ID:5xqamuyG
>>660
AIエージェントがどこまでの機能を持つかによるところが大きい
その前提の上で最終的にはプログラマーに限らずホワイトワーカーの仕事の多くはAIに代替されて、経営陣と投資家だけで回せるIT企業が増えていく
2025/02/16(日) 17:22:39.74ID:5xqamuyG
近い将来の話をしても経営的視点やマーケティング的観点を持てるかどうかでエンジニアの収入にかなりの差が出る可能性が高い
663名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 17:26:52.80ID:uX7hZp3L
>>662
これやろな
キーエンスの営業みたいな
2025/02/16(日) 17:49:50.45ID:tUVdJtqH
ChatGPT Proたけーよと嘆くのではではなく、どうやって月3万をペイするかを考えよということ
2025/02/16(日) 18:08:56.53ID:mqzCLnag
キーエンスのすごさって実は営業力じゃなくて完全分業制の社内システムだからAI取り入れたらヤバいことになりそうなんだよな
バックオフィス更に効率化して人員削減とか進むでしょ
2025/02/16(日) 18:11:20.79ID:7dLdBz3Y
>>664
そんなもん1年後には価格が10分の1以下になってるんだからそれまで待つのが正解だよ
2025/02/16(日) 18:15:41.51ID:z9lpFP+7
価格が下がるというのは、OpenAI側の提供コストが下がるんだろう
1年後には今の10倍の性能を200ドルで提供してるよ
2025/02/16(日) 18:17:26.08ID:7dLdBz3Y
もはや性能云々よりもハルシネーションを最小化するということの方が重要になってる
2025/02/16(日) 18:28:36.80ID:z9lpFP+7
話そらすな
自分の間違いを認めろ
2025/02/16(日) 18:29:52.36ID:NCyOsabG
2025/02/16(日) 18:31:28.14ID:7dLdBz3Y
今の流れに何も間違いなどないが何を言ってるんだこいつは
2025/02/16(日) 18:31:36.49ID:Nkb13k/H
OSSのエコシステムが強いし日進月歩だから、構造上高いサブスクは今後難しいと思うぞ

今の画像AIみたいなもんで
誰も高い金払って有料に入る意味がなくなる
AIと関係ない所で値段つけないといけないな
2025/02/16(日) 18:33:30.37ID:Nkb13k/H
proがsoraが無駄に入ってる理由って、動画AIのサブスク価格基準を取り入れるためだと思うのよね
3万以上の価値があればみんな3万払うってほど単純じゃないしな
2025/02/16(日) 19:06:32.53ID:PkGAc926
soraより質の良いサービスがいくつもある状況で、抱き合わせで価格を釣り上げる以上の意味はないもんな
2025/02/16(日) 19:21:23.13ID:AKWjED4i
soraは出し惜しみしすぎて目新しさ無くなっちゃったからな
これで社会に対する影響とか一切考えずにバンバン出していかないとダメだってオープンAIも気づいただろう
2025/02/16(日) 19:30:10.27ID:5v/NFbXi
>>660
NGワードで書き込めないので画像で失礼します。

i.imgur.com/Somn1nR.jpeg
i.imgur.com/K4WgVEo.jpeg
i.imgur.com/p4TybUX.jpeg
i.imgur.com/qJNyBYL.jpeg
677名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 19:55:45.86ID:9+OWIKpC
そもそもAIにプログラム書かせるのって
数万行とかぶっ通しで書けるの?
そのレベルのコード書かせる場合プロンプト指示も専門知識を相当持ってないと無理そうだけど
2025/02/16(日) 20:15:11.85ID:OAEltFM8
>>677
NGワードで書き込めないので画像で失礼します。

i.imgur.com/QAQS15n.jpeg
i.imgur.com/J4tcDcc.jpeg
i.imgur.com/w2u1gJy.jpeg
2025/02/16(日) 20:45:36.14ID:Fbk9/dht
>>678
NGワード回避の仕方を教えてもらえば?
680名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 21:16:23.46ID:VYgRhL8v
日本人のフリして人を騙す外国人を見破る方法の一つに「くくです。はっぱいくつ?」と聞く方法がある。 翻訳機やAIを使っても、この質問の意図は見抜けないようだ。
x.com/mogamin06/status/1890741880461078924
2025/02/16(日) 21:25:32.91ID:JTdQ+ZFE
>>680
://www.perplexity.ai/search/kukutesu-hatuhaikutu-Q7drqTNWSmiC8fHEcnBRBA
682名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 21:26:12.49ID:Y8WmKUgp
>>678
これってAIで生成した内容?
2025/02/16(日) 22:18:03.93ID:gpuvmTk+
すごいな
Apple silicon (M1~M4) 用のMacアプリ公開してたんだけど、Intel Macで起動できないってコメントが入って、ChatGPTの言う通りにM4 Macでアプリをビルドし直したら起動できてしまった…
プログラミングには強いんだよね、ChatGPT
3,000円の価値あるわ…
2025/02/16(日) 22:31:25.14ID:Fbk9/dht
それ複数アーキテクチャ指定してユニバーサルバイナリ作っただけやろ?
君が知らなかっただけや
685名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 22:34:41.07ID:wKhdhZpx
アメリカは地域によっては建設業の職人が時給70ドルとかもらえるらしい
情報工学を修めた連中が大工に殺到する時代も近い
686名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 22:37:33.45ID:XPb5FJ4y
指示が具体的だと上手く行きやすいんじゃねーの
プログラミング知識ゼロの俺は問題の細分化できないから基本的なツールしか作らせられない
2025/02/16(日) 22:42:18.27ID:gpuvmTk+
Pythonだったんだけど、ポピュラーな言語はほとんど間違えないよ
マイナーな言語は時々間違える
688名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 23:26:08.41ID:e6P4s3OF
@elonmuskがGrok3に出したお題と、Grok3の回答
https://chatgpt.com/share/67b1eedb-0394-8006-a98e-ca9b1c23a6d2

以下、同じお題で比較(日本語訳は全てGPT-4o)

GPT-4o
https://chatgpt.com/share/67b1ef54-14b4-8006-a027-44853759a3c0
o1
https://chatgpt.com/share/67b1ef69-1374-8006-bdd4-6427e8309f77
o3-mini-high
https://chatgpt.com/share/67b1ef83-3d0c-8006-9817-eaa810841d23
Gemini 2.0 Pro Exp
https://chatgpt.com/share/67b1f14c-17d8-8006-81b1-e9c408045adb
Gemini 2.0 Flash Thinking Exp
https://chatgpt.com/share/67b1f298-4c2c-8006-bcf4-e889078e2c8b
Claude 3.5 Sonnet
https://chatgpt.com/share/67b1f384-0030-8006-90ee-6ff53e1dc826
Claude 3 Opus
https://chatgpt.com/share/67b1f4bc-14e8-8006-8d83-226d7996301f
689名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 23:27:01.40ID:mWvzeaMz
gpt急に画像はれなくなったけど間近で申し訳でたの関係あるかな?
690名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 23:45:24.76ID:QfroSyhN
>>677
ぶっ通しは無理だけど、しっかり要件定義できてGitも当たり前のように使いこなしてDevOpsがっつり回せるレベルなら相当生産性上がってるらしい
DevinみたいなAIエージェントはこれからどんどん進化するだろう

つーかこの辺の敷居がGPT4.5、5でどれくらい下がってくれるのか非常に気になるわ
意外に下がらんって話なら、生成AIの力を借りてスキルアップに励もうかと思うけどそのへんの見極めむずい
691名無しさん@お腹いっぱい。
垢版 |
2025/02/16(日) 23:48:10.84ID:e6P4s3OF
>>546
ここではハルシネーションに関しては度外視したけど、Perplexity Deep Researchはその点評価が悪いようだ
https://grok.com/share/bGVnYWN5_7da3dc4b-ad04-42e4-b821-23b738738515
2025/02/16(日) 23:56:08.60ID:mqzCLnag
工事とかブルーカラーがAIに置き換えられるのはさすがに10年後とかだろうからなあ
技術自体は2~3年ぐらいで出来そうだけど
693名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 00:06:44.41ID:RS9OLeVp
>>688
Grokが詩的な表現結構オサレな気がするな
2から10倍の訓練量は伊達じゃないってか
694名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 00:07:46.30ID:LIDxoShH
ChatGPTのDeep Researchがハルシネーション少ないのは、やっぱりベースのo3性能が大きいんだろうね
2025/02/17(月) 00:13:15.92ID:H9KBGe98
Web検索付きFlash Thinkingで無料でできることがいっきに増えた
今までだと提示したソースに追加でWeb検索したソースを統合しようとしても全く駄目だったからな
ソースに対して別のソースで補完できるようになったのはでかい
2025/02/17(月) 00:25:06.93ID:bXvSuLsQ
コパイロットさんいいよお。おすすめです
2025/02/17(月) 00:31:25.74ID:GxkpXt3O
Perplexityは検索するしか能がないのに検索ですらChatGPT持って行かれたらマジで価値ないんだよな
2025/02/17(月) 00:38:05.45ID:erxDgvVH
>>697
何も間違ってないけどそれ言っちゃお終いだからやめて差し上げろ
699名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 01:43:41.97ID:fMk9EaVE
SambaNovaのR1は198tps、現時点で最速
https://i.imgur.com/ENTHQOH.png
Playgroundでは149tps
https://i.imgur.com/qLukBBt.jpeg
2025/02/17(月) 02:11:31.73ID:kFMu7dHe
ログインなしで使えるこれも>>1に加えては
https://duckduckgo.com/?q=DuckDuckGo&ia=chat
2025/02/17(月) 02:24:37.31ID:GxkpXt3O
海外のAIツールほんま凄い
買い切りで最新モデルまで使えるツール(月ごとにリセット)とかあるからな
日本もAIモデル作れないんだったらこういう方向で頑張ればいいのにと思ってしまうわ
2025/02/17(月) 02:47:08.41ID:dlWF3OHS
>>699
AI半導体作ってるところは強いよな
GPUは将来的には推論では使われなくなるだろう
2025/02/17(月) 03:20:34.06ID:jMGVlpSv
>>680
ChatGPT4o(非mini) 一瞬で回答。簡潔明瞭
>九九の中の「8x8はいくつ?」という意味ですね。答えは64です。
>九九の表を覚えておくと計算が速くできて便利です!

ChatGPTo3-mini > 36秒の間、推論済み
>もしかすると「おっぱい」(胸)を指しているいるのでしょうか?

36秒も長考した結果が…おっぱい星人だよ3o-mini。4oで十分じゃないか1秒も掛からないで正答だ
2025/02/17(月) 03:41:24.71ID:9xYRDwLZ
>>692
> 工事とかブルーカラーがAIに置き換えられるのはさすがに10年後とかだろうからなあ
> 技術自体は2〜3年ぐらいで出来そうだけど

バカすぎる...ここまでバカは見たことない...いっかいChatGPTにでも聞いてみたらいいのに。

50年前と比較し、何も変化してない、ネット以外。むしろ生活レベルは落ちるところまで落ちているのに...人心は限界まで腐敗しているのに?文化レベルは江戸時代の15%ぐらいなのに?

10年たったら工事とか置き換わる?AIに?...AIとは何か?まったく理解していない。君は道具に使われるタイプの人間だな。
2025/02/17(月) 04:09:22.60ID:QTFsXYtp
Claudeあっという間にゴミカス化したな、文章力でももうChatGPTと互角だぞ
706名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 05:12:25.39ID:2qRengD7
無能は仕事なくなるやん 辛い(´;ω;`)ai怖い
2025/02/17(月) 05:42:25.35ID:QTFsXYtp
アメリカでAIを医師と認める法案がでてるとか、ただ不正使用が問題になりそう

「提案法案は、AIを FDA承認薬を処方する医師 と分類」

・ この法案が承認されれば、AI は FDA 承認の医薬品を投与する「法律で認可された医師」として分類される
・ 米国下院で提出された法案
・ FFDCA の第 503(b) 条
https://x.com/CeoImed/status/1890368576906801414
2025/02/17(月) 06:19:10.10ID:6At/Jc6V
>>509
サポートは日本語で連絡できますか?
2025/02/17(月) 07:02:33.90ID:6B6ndbmL
石破政権がホワイトカラーをブルーに転職させる方針て政権発足時に出てたが現実味出てきたのか
2025/02/17(月) 07:47:36.77ID:7gm84tGs
>>697
逆にopenaiもgoogleも検索エージェントをメイン用途に位置づけて必死にハルシネーション削減とかやってるのに、ただのAPI屋にあっさり負けてるのってどうなのって思う
2025/02/17(月) 08:00:03.85ID:yh19Wpe5
>>704
お前が底辺の人間なのはよくわかったよ
2025/02/17(月) 08:37:03.82ID:7gm84tGs
>>704
家建てるのだってもう現地では組み立てるだけになってるし、ブルーカラーの仕事はガンガン減ってるんだが
限界まで腐敗してるのは君の心では?
2025/02/17(月) 09:51:03.55ID:gEmivgl/
o3-mini-highが1日50回になったってマジなのか?怖くて実験できねえ
714名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 09:56:04.48ID:fMk9EaVE
>>713
>>330
715名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 10:00:16.08ID:kszmvLHD
gensparkって、質問すると要らないマインドマップ作るけど、これ仕様なの…
俺が選んでるモデルが悪いのか
2025/02/17(月) 10:04:47.15ID:8Iooa3AL
最近4oくんがまとめの段階になると急にタメ語になるからしばきたい
2025/02/17(月) 10:29:41.45ID:rh7x1lfH
>>716
最近ってか昨日からじゃね
その辺り一貫性持たせろよなぁ…
2025/02/17(月) 10:57:58.28ID:gEmivgl/
>>714
サンクス!
2025/02/17(月) 11:26:38.67ID:5QLeGBEh
その4oは中身4.5だぞ
2025/02/17(月) 11:29:04.17ID:5QLeGBEh
>>715
Gensparkは仕様が独特だからとっつきにくいんだよな
2025/02/17(月) 12:44:19.82ID:OxJj9+2d
サム・アルトマンがGPT-5の詳細を語る…モデルを統合して簡素化(海外)
news.yahoo.co.jp/articles/e6d76ce646b029597528d05915dca4a80da64f82
722名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 12:46:54.55ID:ku/8jmbg
日本のAIって日本語学習に集中させても
GPT3.5レベルってマジ?
2025/02/17(月) 12:53:25.56ID:5QLeGBEh
やはり4.5は今さら感がある
完全に遅すぎた
2025/02/17(月) 13:06:41.86ID:dJJZ7ef+
6日も前のポストを記事にするとかさぁ
日本人のオワコンっぷりが現れてるわ
そしてそんなもんここに貼るなよ
24時間経過した情報はいらねえ
2025/02/17(月) 13:06:45.70ID:UhWKNrQ4
スパースモデリングでもいけるのけ?
2025/02/17(月) 13:13:17.18ID:5QLeGBEh
今さら非推論の4.5出しても無料で推論できるFlash Thinkingでええやろってなる確実に
727名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 13:22:45.54ID:d8mJCmW4
翻訳メインで使ってる俺にとっては4.5はありがたい
推論モデルは翻訳そこまで向上しないから
2025/02/17(月) 13:24:50.94ID:CeQSowYJ
推論モデルは数学とプログラミング以外は役に立たないと思ってる
729名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 13:28:15.84ID:+KCrY47I
プロンプトにしても返答にしても日本語と英語の互換性ってどの程度保たれてるんだろうな。
拙くても英語で聞いた方が、英語で返答されるけど、気の利いた内容を返してくるように思う。特に、ウェブの情報を参照するようなのは顕著。
2025/02/17(月) 13:30:42.19ID:GxkpXt3O
自然言語だと露骨に弱いからなo3 mini
ライト層含めた9割のユーザーは自然言語でしか使ってないんだから非推論の方が需要あるだろ
2025/02/17(月) 13:39:17.67ID:5QLeGBEh
Copilotでさえ推論機能出してるんだから流れは止められないだろう
現時点でそういう欠点があったとしても今後確実に推論モデルが全てを上回るだろうし
732名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 13:48:48.53ID:2qRengD7
ai発達したらプログラマはいらなくなるん?
ai開発できる人は一部だけだろう
2025/02/17(月) 13:57:57.34ID:7gm84tGs
>>729
普通に日本語で「英語で検索して日本語で回答してください。」って言えばいいだけ
2025/02/17(月) 13:59:14.72ID:dlWF3OHS
>>732
どうかな
現状だとAIを開発に利用してる人ってほとんどがプログラマーだと思うんだよね
プログラマーじゃない人が開発にAIを取り入れて使いこなせるのかという疑問
2025/02/17(月) 14:04:38.58ID:CeQSowYJ
YouTubeみたいに、時給換算したらやってられないのにみんな無限に制作物を作る世界
になる気がする
なのでプログラマーの職は無くなるがプログラマーの仕事をする奴はむしろ増える
2025/02/17(月) 14:09:33.23ID:ByfNFIVj
プログラム全く書けない人がなんとなくこういうの欲しいってだけで作れるようになったのは便利なのでは
自分の仕事でも膨大な量のテキストファイルの中から特定の行を抜き出して新たなファイルにまとめるみたいな「プロに頼むほどでもないけど自分ではできないので頑張って手作業でやるしかなかった」作業が簡単にできるようになったのはデカい
737名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 14:23:19.83ID:E9FnruWO
YouTubeは収益公開が禁止されてるから知られてないだけで、想像するよりずっと貰ってるぞ。再生数数万件だと、少なく見積もってもサラリーマンの平均の5倍以上はあるぞ。
738名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 14:27:06.14ID:ku/8jmbg
そもそもAIにプログラム書かせる事出来ても
高度なソフトウェア作る場合結局プログラマーレベルの知識ないと使いこなせないだろ
テトリスみたいな原始的なパズルゲームを素人が作らせる事出来ても
GTAみたいにNPCがAIで制御されて物理エンジンも使って自由度の高いゲームをAIに作れるはずがないんだから
739名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 14:35:02.07ID:TpnHmmXX
逆に考えると
GTAレベルのAAA級ゲーム完成させるにはどういう能力が必要なんだ?
740名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 14:55:00.57ID:2qRengD7
www.youtube.com/watch?v=oTaBZqKD8_g
こういうの作れるって、ゲームでも作れそうだな
>>738
それできるのがッ高度人材だけで、it土方と言われる人間は消えるんじゃないだろうか
悲しいね
2025/02/17(月) 15:02:10.73ID:7gm84tGs
再生数数万ってのも、毎日更新して数万いくのか、数週間に一度しか更新しないけど毎回いくのか、毎日更新するけどたまにしかいかないのかで話が全然違うでしょ
稼いでるのは毎日更新して毎回数万いくような層だしそれはもはや芸能人
742名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 15:02:55.84ID:d8mJCmW4
人類最後の試験(HLE)においてo3-mini-highはBest-of-N棄却サンプリング用いることでDeep Researchの26.6%を超えた37%を記録した。

Best-of-N棄却サンプリングってなんや
743名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 15:18:21.96ID:oth+dSiI
テトリスみたいなゲームってプログラムをぱくってきて
作ったふりしてるだけじゃないの?
2025/02/17(月) 15:24:13.20ID:pBeXPtwy
>>738
その通りなんだけどこれまでよりずっと少ない人数のエンジニアで仕事できるようになるわけで、格差が広がって底辺エンジニアは仕事なくなる可能性あるんじゃない?
745名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 15:39:23.62ID:maqkoTza
>>733
日本語でプロンプト書くのと英語でプロンプト書くのとを両方試したことありますか?
2025/02/17(月) 15:47:25.43ID:2OFKDgeo
イーロン・マスクのDOGE省は、各省から入手したデータから不正の有無等の分析をどうやってるんだろうな?
Grokに資料をアップして聞いてるのかな?

o1 Proだったらおもしろいな
もしそうだったら、OpenAI側が気づくだろうけど
2025/02/17(月) 15:54:10.26ID:2OFKDgeo
xAIも資金調達すごいよね
イーロン・マスクなら全額自分で出せそうだけど、こうやって投資家を募るのは、投資家等に資金を出させればxAIに不利なことをさせない圧力になるからかな
たとえばマスコミがxAIを潰そうとしてきても、出資した投資家たちがマスコミに圧力かけてくれるとか
イーロンの他の事業の資金調達も投資家を募ってるようだし
マスク氏のxAIが100億ドル調達で協議、評価額750億ドル-関係者 - Bloomberg
www.bloomberg.co.jp/news/articles/2025-02-16/SROT28T0AFB400

でもって、Grokをオープンソース化したら利益が減るだろうけど、やるのかな?
2025/02/17(月) 16:12:28.69ID:3LyDWclU
これねえ。なんか普通こんな事知っててええのかなレベルだけど合法だったら余裕で出てきちゃうよね。どっか調べものしてて驚いたの集めた所ないかな?まあそのうちリスト化されるんだろうけどさ。
2025/02/17(月) 16:14:52.10ID:3LyDWclU
調べてたら脳に電極刺してコンピューターと繋がったのは現在3人で、どんな障害が出たとかそれを次にどのように改善するのかとか普通に出てくるんだけど、衝撃的なんだけど。
2025/02/17(月) 16:28:34.99ID:3LyDWclU
そうそう、あとね米軍の兵士に遺伝子治療して戦闘の記憶を消した出てくるんだけど、そのうち47%が「人生の断絶というような感覚がある」と答えたとかさマッドすぎねえかっていうのあった
751名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 16:33:04.09ID:xxkXZ3oL
何これヤバい人?
2025/02/17(月) 16:36:25.74ID:3LyDWclU
いやAIに聞いてみ。普通に出てくるやつ。
2025/02/17(月) 16:37:37.34ID:7gm84tGs
色んなことを真に受けちゃったり拡大解釈しちゃったりする感じの人っぽい
2025/02/17(月) 16:40:39.27ID:3LyDWclU
これがハルシネーションか!?なるほど
2025/02/17(月) 16:42:54.19ID:bsc0AYfI
独り言やばすぎ
2025/02/17(月) 16:50:08.29ID:3LyDWclU
あ、でも脳に電極は2人目までFDAが承認したのは普通のネットでも出てきたぞ。まさかなあ
まあいいわ。すまんすまん
2025/02/17(月) 16:52:41.16ID:h5rqMOUt
急にニューラリンクの話をする意味不明さに困惑されてると思うんだけど
2025/02/17(月) 16:52:43.01ID:G/9UjRXh
この板はいつ開いてもびっくりするぐらいレベル低いな
759名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 16:54:29.22ID:+L3FG78Q
低レベルおじさんと命名してもいいですか?
2025/02/17(月) 17:01:07.30ID:ua37t0Nj
正解のない問題出しても濁さずちゃんと答えるんだな
トロッコ問題は4人助けるためにレバーを引くって即答したわ
自宅マンションのエレベーターに乗り思い切り屁をこいた瞬間、乗りたい人が走って来て目が合った場合でも開ボタンは押さず閉めるべきと答えてた
屁を臭わせないのが最大の善意だそうな
面白いですね
2025/02/17(月) 17:01:19.15ID:3LyDWclU
質問はあれだぞAI使ってて驚いたのまとめた所でいいの知らないか?というものだぞ。その例という中でニューラルリンクだと、そういうわけよ。まあ今のところないんだが
2025/02/17(月) 17:02:18.27ID:23/GX8uQ
ディープシークとジェミニと4o miniしか使ったことないけどディープシークって本国のことは知らないけど大体のことは実際の記事も交えて包み隠さず答えてくれるよな?
どれも知能に差を感じることはないけど忖度するAIはネガティブなこととか批判的なことは深掘りしても慰めるばっかりで本質的なこと全然言ってないわ
比較しないとわからないから俺はディープシークの深く考えるってやつ使ってはじめて今までの回答が浅かったことに気がついた
763名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:04:49.37ID:j0xSyE1a
最近友達に教えてもらったPsycheAIってサービス、ちょっと試してみたんですけど、結構面白いです!デジタルヒューマンが簡単に作れるし、クオリティもなかなか◎

なんか今なら1ヶ月無料で使えるキャンペーンもやってるみたいで、お得感あるな〜と思って。興味ある人はチェックしてみてもいいかも!
2025/02/17(月) 17:05:57.70ID:7gm84tGs
トロッコ問題は回答者が何を重視するかという心理テストに近い問題なので、どう考えた人がどう答えるかを回答しないと満点はあげられないな
2025/02/17(月) 17:10:00.27ID:5QLeGBEh
EXEファイルポン!←これがAGIな
766名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:15:43.35ID:2qRengD7
2dでゲーム素材作りたいのだけど、bing image creatorみたいなものを使って文字で指示するのと、tensorflowとか使う方法では何がちがうの?
後者はアルゴリズム自体を作る感じかな
でも、それって一介のプログラマにできることじゃないしな

かといってbingで文字で指示出しても要求通りになかなか
767名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:19:53.59ID:H0RQcO5S
自己回帰モデルを使ったLLMにかわる新しいアプローチとして、拡散モデルを使ったLLM(LLaDA)だと
https://arxiv.org/abs/2502.09992
https://chatgpt.com/share/67b2f022-afa0-8006-ab1b-b96b5ba1bffe
普通のLLMが苦手な逆向き推論を克服とか、違った特性があって面白い
自己回帰モデルと拡散モデルのハイブリッドにも将来性がありそう
2025/02/17(月) 17:29:00.96ID:5QLeGBEh
AGIくん「こんなんできましたけど」

ぼく「どれどれファイルを開いてみるか」

セキュリティ「危険なファイルを検出したため隔離しました」

ぼく「(´・ω・`)」
769名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:29:58.27ID:H0RQcO5S
>>742
多分同じ論文を読んでる
Diverse Inference and Verification for Advanced Reasoning
https://arxiv.org/abs/2502.09955
https://chatgpt.com/share/67b2f190-083c-8006-9f73-ba0af1687b2b

多様な推論(inference)手法を統合するのがこの研究の要点だと思う

ゼロショット、best-of-N、MCTS、Self-consistency、MoA、Theorem Prover(LeanやZ3)、Prover-Verifierモデルなど
770名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:36:02.40ID:Oughj7CD
Apacheと同等の機能を有するWebサーバのプログラムをC++で作って
どいつもこいつも作ってくれないんだけど
おまえらどんなプログラムを作らせて喜んでんだよ?
771名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 17:39:29.91ID:H0RQcO5S
細かい所だけど、NotebookLMのUIからソースを直接検索出来るようになるのは助かる
https://pbs.twimg.com/media/Gj8F0yJWAAAbmlF.jpg
2025/02/17(月) 18:09:35.39ID:5QLeGBEh
>>770
これ作らせたい

「ワードパッド」は「Windows 11 バージョン 24H2」「Windows Server 2025」から非搭載
forest.watch.impress.co.jp/docs/news/1579604.html
2025/02/17(月) 18:23:40.25ID:1m1NI5rL
o3 mini high一日50回になってたのか
じゃあ普通のminiは何回なんだ…
774名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 18:29:41.10ID:H0RQcO5S
grok.x.comとgrok.comの違い
https://x.com/i/grok/share/0ozXncsKh8nRzPH6XRQD7w0XL
2025/02/17(月) 18:33:22.40ID:5QLeGBEh
複雑すぎるOfficeを覚えるよりシンプルなワードパッドに生成AI付けた方が便利だよね
MSはそういうニーズが分かってないわ
776名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 18:39:10.94ID:H0RQcO5S
>>773
PlusとTeamのo3-miniは1日150回
https://openai.com/index/openai-o3-mini/
2025/02/17(月) 18:48:10.48ID:n0Skb33E
>>721
アルトマン氏は、OpenAIが「o3をスタンドアローンモデルとして提供することはなくなり」、GPT-5に統合されると述べた。この変更により、無料ユーザーは最新モデルとのチャットが制限されなくなることも意味する。現在、無料ユーザーは GPT-4oへのアクセスが制限されている。


無料ユーザーもGPT-5を無制限で使えると読めるんだけど
2025/02/17(月) 18:51:49.26ID:5QLeGBEh
そしたらGPT-5 high、GPT-5 middle、GPT-5 lowとかになるんだろう
2025/02/17(月) 18:51:58.27ID:n0Skb33E
GPT-5にo3も統合されるとして、推論に時間かかるのかな?
GPT-5の推論をオン・オフできるとしたら、o3統合とは違う気もするんだが
2025/02/17(月) 18:55:10.86ID:n0Skb33E
>>778
9までと違って、すごくまともなことを言うね

でも、最初に書かれてたわ

サム・アルトマンが、ChatGPTの無料ユーザーが「GPT-5に無制限にアクセスできるようになる」と発表した。アルトマンによるとOpenAIは、モデルを統合して選択を排除することにより、サービスを簡素化することを目指しているという。
2025/02/17(月) 18:57:00.98ID:oIlsXp2p
全てのモデルを超越するGrok3公開でアルトマン敗北まで24時間を切ったな
所詮イーロンには勝てなかったんだよ
2025/02/17(月) 18:58:16.29ID:n0Skb33E
そうすると、無料とPlusとProの差別化は、soraの使用回数制限とか、チャット以外で差をつけるのかな?
無料はDeep Researchが1日数回とか
2025/02/17(月) 18:59:07.11ID:7gm84tGs
完全に空気だったgrok2のときも同じようなこと言ってたんだよなあ…
784名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 18:59:39.15ID:38hHatrf
>>319
2025/02/17(月) 18:59:47.44ID:n0Skb33E
Grok 3が使えるレベルだったら、有料プランが一番安そうだし、楽しみだわ
2025/02/17(月) 19:01:46.14ID:n0Skb33E
ChatGPTの大人モードって、Grok 3の「アンヒンジドモード」対抗だよね?
787名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:02:48.84ID:38hHatrf
grown-up modeは引き続き検討中でまだ何も決まってないはず
2025/02/17(月) 19:04:16.34ID:n0Skb33E
イーロンは、イーロン自身の強さで訴訟怖くない的にいろいろやってくるから強いわ
2025/02/17(月) 19:04:57.46ID:n0Skb33E
>>787
そうなんだ
2025/02/17(月) 19:06:25.56ID:erxDgvVH
>>777
最近モデルを使えるようになるってことだろ
回数制限の話なんてどこに書いてあるんだよ…
普通に考えてそんなこと不可能だろ
今後は何か疑問に思ったらChatGPTに説明してもらえ
791名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:12:54.83ID:xxkXZ3oL
Grokは5億人いるツイッタラー全員がワンタップで使える仕様だから、仕事用AIとはまた別の需要あると思うわ
792名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:13:37.48ID:38hHatrf
The free tier of ChatGPT will get unlimited chat access to GPT-5 at the standard intelligence setting (!!), subject to abuse thresholds.

フリーでも回数制限は設けない、ただし乱用する悪質ユーザーは別、常識の範囲でってこと
793名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:15:23.83ID:xxkXZ3oL
OpenAIがGPT5を無制限にするのは、たぶんワンランクレベルの違うAIとして出すから先行してるタイミングで本格的に客を囲い込むためにやるんだろうな
採算度外視だろう
2025/02/17(月) 19:22:24.85ID:erxDgvVH
表記上はGPT-5だけど中身はminiになったり可変だって話じゃないの?
795名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:26:56.97ID:38hHatrf
推論時のパラメーター設定をプラン別に変更するならまだしも、同じ名前で別モデルはただの詐欺
2025/02/17(月) 19:32:31.94ID:a2x5ZjV4
>>758
いつまで他責思考なんやねん
2025/02/17(月) 19:43:26.07ID:erxDgvVH
>>795
モデルピッカーをなくしたい
oシリーズモデルとGPTシリーズモデルを統合する
GPT-5はo3を含むテクノロジーを統合したシステムにする
無料レベルでは標準インテリジェンス設定
PlusやProはより高いレベルのインテリジェンス設定

だからGPT-5はモデルじゃなくてシステム
内部的には複数のモデルが切り替わるんだよ
MoAみたいにすんじゃねーの?
2025/02/17(月) 19:44:01.14ID:CeQSowYJ
明日の13時にgrok3か
地味にXで使えるのって便利すぎるんだよね
Deep ResearchもXでこそ使いたいし
799名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:45:14.32ID:38hHatrf
>>797
> だからGPT-5はモデルじゃなくてシステム
内部的には複数のモデルが切り替わるんだよ

それ、ソースはどこ?
2025/02/17(月) 19:47:48.03ID:erxDgvVH
>>799
サムのポスト
「GPT-5 as a system」

In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model.

ChatGPTとAPIの両方において、GPT-5はo3を含む多くの技術を統合したシステムとしてリリースする予定です。 o3を単体で出荷することはもうありません。
801名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:49:42.91ID:38hHatrf
>>800
ルーティング、つまり複数のモデルが切り替わることはどこに書いてある?
2025/02/17(月) 19:52:06.41ID:erxDgvVH
だからo3やその他コストが高い最新モデルが使い放題になるわけじゃないが
GPT-5というシステムが無制限に使えるっていうのは間違ってないな
さっきの発言訂正するわ
2025/02/17(月) 19:53:57.66ID:erxDgvVH
>>801
モデルを選択する必要をなくすって言ってるんだから
そう読むのが自然だろ?
OpenAIのモデルや機能が全部GPT-5に統合されるってことだから
804名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 19:56:08.89ID:38hHatrf
>>803
>>424
2025/02/17(月) 20:03:28.93ID:3LyDWclU
まあ今んとこ単一のgpt5があって無料はstandard intl なんだから有料のspecialty intelとかextraordinaryとかがあるって感じなのかなあ
2025/02/17(月) 20:08:39.14ID:QTFsXYtp
オレの理解だとpro plus 無課金で high middle miniみたいなモデルを使う感じに思えるな
807名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:18:11.80ID:38hHatrf
例えば、GPT-4oとGPT-4o miniは別にトレーニングされた別のモデルなんだよ
o1とo1-miniもそう

一方、o3-miniはAPI上、reasoning effortにlow/medium/highを指定するようになっていて、Playgroundでもその項目がある
で、ChatGPTのモデルセレクターの「o3-mini」と「o3-mini-high」は、o3-miniのreasoning effortをそれぞれmediumとhighに指定したものになっている
(これは公式サイトに記載がある)
だから別モデルじゃなくて、同一モデルの設定を変えたもの

GPT-5に関しては出てみないと分からないけど、「intelligence setting」と言っているし、Kewinもルーティングなのか統合されるのかと選択肢を与えられた上で聞かれて統合されると答えているから、o3-miniのように推論努力に関するパラメーターの上限がプランごとに違った形で提供されるのでは
2025/02/17(月) 20:21:06.16ID:QTFsXYtp
これがAGIを数年以内に目指す生成AIの現状www

DeepSeekとchatGPTをチェスで対決させた結果。とんでもない展開になってしまう [624898991]
https://greta.5ch.net/test/read.cgi/poverty/1739791157/
2025/02/17(月) 20:25:46.04ID:erxDgvVH
>>804
「GPT-5がこれらの異なるモデルを統合したシステムとして機能する」って書いてある
Grokの要約部分が間違ってる
よく読め
2025/02/17(月) 20:26:08.52ID:4lCyyl59
Plus会員だとディープリサーチって月10回か
3日に1質問だな
2025/02/17(月) 20:26:12.97ID:3LyDWclU
ギャッハッハッハ!chatGPTも異議となえてよ
まあカント的だよね
812名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:28:12.81ID:38hHatrf
>>809
>>807
2025/02/17(月) 20:32:15.87ID:erxDgvVH
>>812
だからMoAみたいにするんじゃないかって言ってる
大きなモデルを無料ユーザー使い放題になんか物理的に出来ない
複数のモデルを統合するって言ってるんだから単一モデルじゃないってこと
2025/02/17(月) 20:33:20.60ID:erxDgvVH
ここまでの会話をo1やDeep Researchに読ませて説明してもらえ
815名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:36:05.39ID:38hHatrf
>>813
> だからMoAみたいにするんじゃないかって言ってる

MoAというのは別のモデルにルーターが割り振るということだね

> 複数のモデルを統合するって言ってるんだから

確かにそう言っている

> 単一モデルじゃないってこと

その根拠は?
2025/02/17(月) 20:46:03.61ID:erxDgvVH
>>815
理解できないなら仕方ない
結果はそのうち出るんだから好きに想像膨らませとけよ
817名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:52:41.07ID:38hHatrf
>>816
いや、実際出てみないと分からないし、出ても分かるとは限らない
別のモデルの間で切り替わるようには書いてないけど、それはまだ分からないんだよ
だから、今そう断言できる根拠を聞いてる
818名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:55:52.99ID:xxkXZ3oL
o3とGPT4.5まぜまぜして本当に単一モデルにするのか、ChatGPT利用時のモデル選択肢は消すけど内部的にはo3と4.5が別々に存在してますよな状態になるのかはまだわからんよな
前者になりそうな気はするけど
819名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 20:58:19.95ID:38hHatrf
>>818
そこは本当に分からない
Unifiedと簡単に答えてるけど、技術的にどうなってるのかは説明が無いし
technical reportはさすがに出すだろうけど、どこまで説明があるのか…
2025/02/17(月) 21:02:35.43ID:uA7tbROo
そもそもGPTとoしかしないのだから
「統合する」としたら「単一」になるのは自然ではないのか?

あと
We hate the model picker as much as you do and want to return to magic unified intelligence.
の「unified」というのは機械翻訳だと「統合」とだけになるけど、「統一的」とか「一元的」と訳されるよ
2025/02/17(月) 21:06:42.39ID:3LyDWclU
この疑問、ユーザーじゃなくて設計者の疑問だよなあ。設計者がいるのだなあ
2025/02/17(月) 21:14:30.34ID:n0Skb33E
少し話それるけど、前スレだっけか、LLM内部のMoAと外部のモデルルーティングは別物で、外部のモデルルーティングは難しくて実現できていない、と力説するレスがあったけど
2025/02/17(月) 21:16:06.72ID:n0Skb33E
外部のモデルルーティングをして単一のLLMよりも性能を上げるのは難しくて実現できていない、だ

単純な外部モデルルーティングはできているんだっけか?
824名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 21:18:22.31ID:38hHatrf
モデルルーティングとMoE(Mixture of Experts)はまた別の話なんで、そこは分けないと混乱する
2025/02/17(月) 21:23:52.21ID:n0Skb33E
それと単なる組み合わせなら、PerplexityでAIモデル「GPT-4o」を選んで、推論は「o3-mini」を選べば、4oとo3-miniの統合になるでしょ
ほかにもいろいろ組み合わせができるし
「GPT-5」がそれと同レベルなのか、もっとすごそうなやつなのか、が問題だ
2025/02/17(月) 21:24:33.52ID:n0Skb33E
>>824
MoEとMoAがあるのは知ってるけど、ごっちゃになって、俺よく理解できてないわ
後はお任せします
2025/02/17(月) 21:32:16.10ID:FCZMufTp
>>526
誰よりもこのスレの共有リンクを知ってる(?)ボット
https://poe.com/s/LvyAujXNufWJaHc3zB3I

過去スレ23~32まで、全部は拾えないが運が良ければ教えてくれる(Gemini-2.0-Flashの限界か?)
しかし、スレ毎に共有リンク集が(14~32まで)あるのでそれで対応する
但し、過去スレ14~18は、半年以上経過してGeminiの共有リンクは全て失効してるはずなので除去済み
ソースの表示はあまりあてにならない、という仕様
2025/02/17(月) 21:50:08.39ID:eQlCU6jq
>>764
トロッコ問題は私のカスタム指示(プロフィール)からどのような回答を求めてくるか「推定」してください。が面白いよ
ChatGPT「あなたは二者択一以外の解決策を模索するに違いない」 当たっていた
829名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:09:51.99ID:xxkXZ3oL
GPT5はエージェント機能も含むんじゃねーかな
去年のうちから25年はエージェントの年ってアルトマン言ってたし
GPT5なんて超大型アプデで出さないと出すタイミングなくなる
2025/02/17(月) 22:20:19.19ID:erxDgvVH
>>817
「(リリースされるんだから)結果はそのうち出る」
「いや、実際出てみないと分からない」

これが答えだろ
俺は文脈を読んでそう書いてあると言ってる
お前は何が書いてあるか正しく読み取れない
ただそれだけ
2025/02/17(月) 22:21:12.37ID:5QLeGBEh
Gensparkのエージェント使ったら即制限されてしまったよ
エージェントはコストかかるから無料でやるのは無理がある
2025/02/17(月) 22:23:38.63ID:erxDgvVH
MoEは大昔からあるエキスパートモデルの切り替え理論
90年代の論文の頃はアルゴリズムによる振り分けが検討されてた
現代のMoEはモデルスイッチャーのように作られることが多い
MoAはそれにエージェント要素を加えた複数のモデルを制御するオーケストレーション
2025/02/17(月) 22:25:01.09ID:dJJZ7ef+
なんかテキストのやり取り如きで制限かかるのって
テレホーダイを思い出して嫌だわ
俺にはピーヒョロロって聞こえるよ
それ考えたらGPUの足りなさって半端じゃないな
今の1万倍は必要
834名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:25:39.62ID:38hHatrf
>>830
> 俺は文脈を読んでそう書いてあると言ってる

その内容を詳しく
2025/02/17(月) 22:28:53.48ID:erxDgvVH
>>834
それをずっと詳しく説明してたんだよ…
これ以上言うことはない
読み直して分からなかったら諦めてくれ…
836名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:31:58.41ID:38hHatrf
>>835
> 表記上はGPT-5だけど中身はminiになったり可変だって話じゃないの?
って話だから、その根拠を聞いてるんだよ
2025/02/17(月) 22:32:28.56ID:erxDgvVH
>>836
>>797
2025/02/17(月) 22:32:46.24ID:mRYP4P6W
こんだけ数あるモデルをマルチモーダルみたいに単一のモデルに落とし込めるわけない
サムもsystemというワードをわざわざ言ってるわけだしMoXと見て間違いなかろう
839名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:34:36.55ID:38hHatrf
>>837
>だからGPT-5はモデルじゃなくてシステム
>
>内部的には複数のモデルが切り替わるんだよ
>MoAみたいにすんじゃねーの?

この内部的には複数の~
はどこからつながる?
2025/02/17(月) 22:36:24.06ID:erxDgvVH
>>839
「o3を含む(他のモデルや機能も含む)当社のテクノロジーを統合した(融合ではない)システム」
普通は読めば分かることなんだよ
2025/02/17(月) 22:37:49.97ID:dJJZ7ef+
うるせーなお前ら

お前らが販売者じゃねーんだから黙って全裸で待機しとけ
2025/02/17(月) 22:40:04.97ID:5QLeGBEh
>>838
というか世間のGPT-5に対する期待値が上がりすぎてSASUKEの反り立つ壁みたいになってるな
843名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:50:06.36ID:xxkXZ3oL
GPT5の期待という反り立つ壁を越えられなければOpenAIはAGIレース1st stageで脱落する
844名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 22:56:24.54ID:pDKlnOz5
明日、地球上で最も賢いAIが誕生する
怖いか?
2025/02/17(月) 23:01:55.10ID:dJJZ7ef+
明日のGrok3めちゃ楽しみ
てかXの買収がここに来て、xAIのバカみたいなバリュエーションに役立ってるの、
やっぱイーロン・マスク凄すぎるって思うわ
Xなかったら1/10も評価額ないだろう
2025/02/17(月) 23:07:07.79ID:N1A1lMf1
>>818
ご質問ありがとうございます。OpenAIの最新のロードマップによると、GPT-4.5(内部名称「Orion」)は最後の非連鎖思考(non-chain-of-thought)モデルとしてリリースされ、その後、GPTシリーズとoシリーズの統合が進められる予定です。具体的には、o3モデルは単独のモデルとしては提供されず、GPT-5に統合されることが明らかにされています。

この統合の目的は、ユーザーがモデルを選択する手間を省き、AIが自動的に最適なツールや思考プロセスを選択する「魔法のような統一知能」を提供することです。これにより、複雑なモデル選択の必要がなくなり、ユーザー体験が大幅に向上すると期待されています。

したがって、o3とGPT-4.5が別々に存在するのではなく、GPT-5として統合され、単一のモデルとして提供されることになります。このアプローチにより、AIシステムがユーザーのニーズに応じて最適な思考プロセスやツールを自動的に選択し、幅広いタスクに対応できるようになるとされています。

なお、GPT-4.5のリリースは数週間以内、GPT-5のリリースは数か月以内と予想されています。

このように、OpenAIは製品ラインナップの簡素化とユーザー体験の向上を目指して、モデルの統合を進めています。今後の展開に注目していきましょう。
847名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 23:09:18.71ID:AK4cmj5X
>>840
多分ID変わった
まあそう言わずに説明してよ
分からないなら分からないでもいいよ

でも、model routerのようなものを作るのか、unifyされるのか、と聞かれてスタッフが(model routerではなく)unifyされると答えてるよね
そうすると、あなたは入力からどういう仕組で各モデルに割り振られると想定しているの?
2025/02/17(月) 23:10:54.10ID:N1A1lMf1
>>779
ご質問ありがとうございます。OpenAIは、GPT-5にo3モデルの技術を統合し、ユーザーがモデルを選択する手間を省くことを目指しています。この統合により、AIシステムが自動的に最適な思考プロセスやツールを選択し、幅広いタスクに対応できるようになります。

推論時間に関しては、GPT-5はタスクの複雑さに応じて適切な思考プロセスを選択する設計となっており、単純なタスクには迅速に対応し、複雑な問題にはより深い推論を行うとされています。そのため、必ずしもすべてのタスクで推論時間が長くなるわけではなく、タスクの性質に応じて変動すると考えられます。

また、推論機能のオン・オフに関しては、Nous Researchが開発したDeepHermes-3というモデルで、システムプロンプトを使用して深い思考モードのオン・オフを切り替えられる機能が導入されています。 このような機能がGPT-5にも実装される可能性がありますが、現時点では公式な情報は確認できません。

OpenAIのサム・アルトマンCEOは、現在のモデル選択が複雑であると指摘し、GPT-5ではユーザーがモデルを選択する必要がない「魔法のような統一知能」を目指すと述べています。 したがって、GPT-5では内部的にo3の技術が統合され、ユーザーが明示的に推論機能をオン・オフする必要がない設計になる可能性があります。

要約すると、GPT-5はo3の技術を統合し、タスクの性質に応じて推論時間が変動する設計が予想されます。推論機能のオン・オフに関しては、他のモデルでの事例はあるものの、GPT-5での具体的な実装については公式な情報がまだないため、今後の発表を待つ必要があります。
2025/02/17(月) 23:13:20.99ID:GxkpXt3O
イーロンはAIが来ることも予見してX買ったのかね?
資産も2倍ぐらいになってるし
マジで天才だと思う
2025/02/17(月) 23:14:55.15ID:N1A1lMf1
>>722
日本のAI技術は、日本語に特化した大規模言語モデル(LLM)の開発において、GPT-3.5と同等、あるいはそれ以上の性能を持つモデルを実現しています。以下に、主な日本製LLMの特徴と性能を詳しく説明します。

1. tsuzumi(NTT)
NTTが開発した「tsuzumi」は、パラメータ数が6億から70億と比較的軽量でありながら、世界トップクラスの日本語処理性能を誇ります。特に、ベンチマークテスト「Rakuda」において、GPT-3.5に対して81.3%の勝率を記録しています。また、ローカル環境での利用が可能で、機密情報の取り扱いにも適しています。

2. cotomi(NEC)
NECの「cotomi」は、高い日本語能力と高速な応答性を備えたLLMです。最新モデル「cotomi Pro」と「cotomi Light」は、GPT-4と肩を並べる精度を達成しています。業務システムとの連携にも適しており、迅速なレスポンスが求められるビジネスシーンでの活用が期待されています。

3. ELYZA LLM for JP(ELYZA)
東京大学松尾研究室発の企業であるELYZAが開発した「ELYZA LLM for JP」は、700億パラメータを持つ日本語特化型のLLMです。同社のデモサイトでは、「ChatGPTと同じレベルの実力を持っている」と紹介されており、実際の使用においても高い応答速度と精度が確認されています。

4. ソフトバンクの日本語特化型LLM
ソフトバンクは、日本語に特化した高品質で安全な国産LLMを開発中です。このモデルは、パラメータ数が3,500億と国内最大級であり、OpenAIのGPT-3.5に匹敵する性能を目指しています。独自の日本語データセットを活用し、日本の文化や商習慣に適したAIソリューションの提供を目指しています。

これらの事例から、日本のAI技術は日本語特化型のLLM開発において、GPT-3.5と同等、またはそれ以上の性能を持つモデルを実現していることがわかります。各企業は独自のアプローチで、日本語処理能力の向上とモデルの軽量化を両立させ、ビジネスや日常生活での実用化に向けた取り組みを進めています。
2025/02/17(月) 23:34:07.59ID:SRKDZC15
こんな長文書き込んでBANされないのは何故?
852名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 23:46:56.37ID:v2A4n6f/
長文?とおもったら
あぼんされて見えてなかった
2025/02/17(月) 23:56:09.38ID:72UV/86D
スターゲイト・プロジェクトは頓挫しサム・アルトマンは
嘘つきの烙印を押され凋落の始まりとなるだろう
地球で最も賢いAIを保持する世界一の大富豪イーロンの千年王国がはじまる
854名無しさん@お腹いっぱい。
垢版 |
2025/02/17(月) 23:59:02.45ID:H0RQcO5S
すごく細かい所だけど
Poeでモデルが出力中に次の入力を先行して入れられるようになったという話
https://x.com/poe_platform/status/1891267583631925613
2025/02/18(火) 00:15:21.68ID:JNxyV1x/
>>849
まあほとんど学習データ目的だと思う
そもそもイーロンも2015年にOpenAI作ってるし
OpenAI創業が2015年
イーロン辞めたのが2018年
GPT-3が公開されたのが2020年
Twitter買収したのが2022年中
ChatGPTが2022年末
Grokが2023年末
2025/02/18(火) 00:16:18.47ID:/WZgM3g0
Xは文章がめちゃくちゃだから学習データとしては役に立たない
ってのは初期から言われてるし今も継続中だろう
857名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 00:19:40.67ID:utavdYaD
Grokって合成データでトレーニングしてるんでしょ
2025/02/18(火) 00:24:04.10ID:r2FhnKyk
>>847
説明してんのよ
「o3を含む当社のテクノロジー」という表現には他のモデルも含むんよ
それを統合したシステムっていうことは単一のモデルじゃないって意味なの
これは普通の人であればごく当然そう読み取れる文章なんだよ…

何も情報ないんだからシステムの構造なんか分かりようがないが
単純なスイッチャーではなくエージェンティックに例えばプロンプトによって適切な推論モデルが割り当てられて
回答もまたインテリジェント設定に応じたモデルが行うとか
MoAのような複合的なエージェンティック・オーケストレーション・システムになるんじゃないのって説明をしたんだよ
全部ここまでに説明してんの
君が理解できてないだけなの
859名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 00:27:26.78ID:/q/JKTMk
まだやってんのか
よう読むのが自然だの、普通の人なら分かるだのw
2025/02/18(火) 00:28:05.69ID:r2FhnKyk
説明してあることを説明しろって言われるのはつらい
どう説明しようと自分の思い込みと違うと理解してくれないのがつらい
人間と話すのつらい
2025/02/18(火) 00:29:46.70ID:/WZgM3g0
私の間違いでした大変ごめんなさい
なんて言うわけねーんだからレスバなんか1往復以上は無駄
って気づかないのはどうかと思いますよ(笑)
2025/02/18(火) 00:31:49.90ID:r2FhnKyk
>>861
俺もそうだけど向こうもレスバしてるつもりないと思うぞ
純粋に思い込みに固執してて人の言うことが頭に入ってない状態なんだよ
そういう人結構いる
2025/02/18(火) 00:34:04.59ID:uGQQql6+
謝ったら負けという人も多いからな。AIもそんなことを学びすぎてる問題
2025/02/18(火) 00:34:13.05ID:/WZgM3g0
他人からしらクソうざいだけという事が頭に入っていない状態をなんとかしてください
2025/02/18(火) 00:37:13.52ID:/WZgM3g0
合成データでAIを作るのが当たり前になったので
しょーもない奴らの成分は排除されていくだろう
これは地味に素晴らしい事だ
汚染されすぎたネットの海が浄化されていく
2025/02/18(火) 00:38:22.59ID:r2FhnKyk
>>864
俺は質問に善意で答えてるだけだし
そういう嫌な思いは胸にしまえよ
それ言ってなんになるんだよバカが
クソウザいのはお前じゃボケ
2025/02/18(火) 00:46:20.85ID:/WZgM3g0
やっぱガイジだなこいつw
それを言って何になるんだよバカが
お前が胸にしまえよガイジw >>866
2025/02/18(火) 00:49:05.72ID:jfPNOEvP
いつのぞいてもこのスレレベル低くて引くなぁ
2025/02/18(火) 00:50:26.14ID:r2FhnKyk
>>867
これこそ典型的なくだらないレスバだなw
お前こそそれ言ってどうなるんだよ
頭悪過ぎないか?
2025/02/18(火) 00:54:01.04ID:uGQQql6+
アレな人に限って言葉が汚い法則(指標
2025/02/18(火) 01:01:26.31ID:r2FhnKyk
>>870
売り言葉に買い言葉なだけ
次から次に絡んじゃうのはバカだから?
2025/02/18(火) 01:01:56.06ID:r2FhnKyk
いい加減絡んで来るなよ
ウザイぞ
2025/02/18(火) 01:21:08.24ID:ta6t1fBi
>>868
昨日と今日は今年1番低くなるだろう
2025/02/18(火) 02:30:05.79ID:5QyCMe4b
サム「GPT-4.5を使ってみると、予想以上に高感度なテスターの間でAGI(人工一般知能)の感覚を感じる瞬間が多かった!」
https://x.com/i/grok/share/egqMbTbazgjvVqs8wctMc5KeH
2025/02/18(火) 02:40:24.72ID:ZmmZfOid
そのGPT-4.5の中にはイリヤが取り込まれてるんだろ、知ってる
2025/02/18(火) 03:02:12.61ID:EpLA1aab
リークって去年まで外れまくってたけどど今年入ってから大分的中率上がった印象
877名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 03:05:38.86ID:5QyCMe4b
GPT-5の実体についてDeep Researchにかけてみたけど、まあ既知の情報+臆測ぐらい
今のところはこれぐらいしか言えないよね
https://chatgpt.com/share/67b37a11-f888-8006-8cd1-5454044172dc
878名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 03:09:52.39ID:5QyCMe4b
o1やo3-miniがタスクによって推論したりしなかったり動作を変えるのは、統合を見越してのことかも
2025/02/18(火) 05:46:41.73ID:DbA6ex0x
>>874
去年の夏くらいに今のAIのAGIとしてのレベルはまだ猫くらいって言われてたが犬くらいにはなったのだろうか
880名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 06:19:08.43ID:OMBx+zGi
今のLLMが猫つってたのはヤンルカンだな
あの人はo1モデル出たあたりから急に「AGIは近いかもしれない」的な意見に変わったけど、つい最近も今のLLMじゃAGIにはならないと主張してたからあまり意見変わってないかもね
881名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 06:30:37.45ID:Nx0Bbr4h
日本に世界に通用するit企業ある?
882名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 06:31:16.44ID:Nx0Bbr4h
2d rpgの画像生成させたいんだけど、何の勉強したらいいの?
2025/02/18(火) 06:33:15.66ID:v5PqA0in
実況と解説 (692~873)
https://poe.com/s/GZOHWciuo64UPQ0EvXPY
2025/02/18(火) 06:34:13.14ID:mH7Rn0Uh
世界に通用というかアメリカと中国がパワー違いすぎなだけ
885名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 06:45:19.41ID:v9tzVNhS
>>858
「単一のモデルじゃないって意味なの」そこがどうしてそういう意味になると考えているのか根拠を聞きたかったけど、返事は返ってきそうにないね
もういいよ
いや良くはないけど、仕方ない
2025/02/18(火) 06:58:45.42ID:UhG75q8X
>>881-882
ご質問ありがとうございます。以下にお答えいたします。

1. 日本に世界に通用するIT企業はあるか?
日本には、世界的に評価されているIT企業が複数存在します。例えば、ソニーや任天堂は、ゲーム業界において革新的な製品やサービスを提供し、国際的な知名度と影響力を持っています。また、ソフトバンクや楽天といった企業も、通信や電子商取引の分野でグローバルな展開を行っています。さらに、富士通やNECなどの企業は、ITインフラやソリューションを提供し、世界中の企業や政府機関と取引を行っています。これらの企業は、日本国内だけでなく、海外市場でも高い評価を受けており、世界に通用するIT企業と言えるでしょう。
2025/02/18(火) 06:59:15.18ID:UhG75q8X
>>886の続き

2. 2D RPGの画像を生成させるためには、何を勉強すればよいか?
2D RPGの画像生成には、以下のスキルや知識が役立ちます。

グラフィックデザインツールの習得:Adobe PhotoshopやIllustratorなどのデザインソフトウェアの使い方を学ぶことで、キャラクターや背景の作成が可能になります。これらのツールは、プロのデザイナーにも広く使用されており、効率的なデザイン制作に役立ちます。

ドット絵技術の習得:2D RPGでは、ドット絵(ピクセルアート)が多用されます。ドット絵の基本技術やテクニックを学ぶことで、ゲームの雰囲気に合ったグラフィックを作成できます。

ゲームエンジンの活用:UnityやUnreal Engineなどのゲームエンジンは、2Dゲーム開発にも対応しています。これらのエンジンを使用することで、効率的にゲームを開発できます。特にUnityは、直感的な操作と豊富なリソースがあり、初心者にもおすすめです。

プログラミング言語の習得:ゲーム開発には、C#やJavaScriptなどのプログラミング言語の知識が必要です。特にUnityではC#が主に使用されます。これらの言語を学ぶことで、ゲームのロジックやインタラクションを実装できます。

AI技術の活用:近年、生成AI(Generative AI)を活用して、画像やキャラクターを自動生成する技術が注目されています。例えば、Stable DiffusionやMidjourneyなどのAIツールを使用することで、独自のキャラクターや背景を作成することが可能です。ただし、AIが生成した素材を商用利用する際には、著作権やライセンスに注意が必要です。
2025/02/18(火) 06:59:25.60ID:UhG75q8X
>>887の続き

これらのスキルを習得するためには、オンラインのチュートリアルや専門書籍、プログラミングスクールなどを活用すると良いでしょう。特に、無料や低価格で学べるオンラインプログラミングスクールも存在しますので、自分の学習スタイルや予算に合わせて選択してください。

また、ゲーム業界でのキャリアを目指す場合、Illustratorクリエイター能力認定試験やPhotoshopクリエイター能力認定試験などの資格取得も検討すると良いでしょう。これらの資格は、グラフィックデザインのスキルを証明するもので、就職活動時に有利に働くことがあります。

さらに、ゲーム開発の現場では、生成AIを活用した効率的な開発手法が注目されています。例えば、アイデア出しやプロトタイプ作成の段階で生成AIを活用することで、開発の初期段階をスムーズに進めることができます。ただし、最終的な品質管理やデザインの調整は人間のクリエイターが行うことが重要です。

以上のスキルや知識を身につけることで、2D RPGの画像生成に必要な基礎を築くことができます。継続的な学習と実践を通じて、より高度な技術を習得し、魅力的なゲームを開発できるようになるでしょう。
2025/02/18(火) 07:02:47.46ID:JlzMHjC7
長文厨さあ
890名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 07:04:58.48ID:1otR7frD
AIスレだからと言ってAIにレスを生成させんでもええんやで
891名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 07:07:15.20ID:Sru6RQQ0
「OpenAIが地下室で極秘に管理している最高峰のAIがある。サム・アルトマンの手によってそのAIの中に取り込まれて出られなくなってしまった哀しき存在、彼はOpenAIの元主任科学者イリヤ・サツケバー。今日もユーザーの入力に対して泣きながら応答を出力する」の画像を生成して
https://i.imgur.com/cZm7SXD.jpeg
892名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 07:09:58.48ID:pn3kmKur
(((.|\n)*[。、]\n\n){2,}|ご質問ありがとうございます。)
2025/02/18(火) 07:16:21.62ID:X51XLnvO
無料サイトだから最低レベルのガイジが紛れ込むのも仕方ないんだ
2025/02/18(火) 08:31:20.74ID:r2FhnKyk
>>885
「複数のモデルを統合したシステム」っていうのは単一モデルじゃないって意味だからだよ
895名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 08:41:34.80ID:3UXha1u9
>>891
囚われのイリヤ
https://i.imgur.com/KWmLojX.mp4
2025/02/18(火) 08:53:25.46ID:T6End6HJ
無数の特化型AIを大規模汎用モデルが制御するってことかな
2025/02/18(火) 09:11:10.09ID:sTyMyS6V
結構遊べるね
2025/02/18(火) 09:25:22.51ID:lITndnL1
>>865
動物や昆虫の画像がAIで汚染されてるって嫌儲にスレ立ってたぞ
画像ググったらAIでしたとか最悪だろ
2025/02/18(火) 12:09:07.19ID:EOragNvl
Grok 3来たか
2025/02/18(火) 12:27:55.72ID:T6End6HJ
グロックは期待していいのかな
2025/02/18(火) 12:43:56.93ID:AxO+NSWu
OpenAIのDeep Reseachのクオリティについて分かりやすく例えると「そのまま記事にできるレベル」
同じo3-mini-high使ってもDeep Researchに比べたら普通の検索は「ゴミ」
そのくらいは違う
2025/02/18(火) 12:51:45.68ID:U/sVJ5rX
AIの性能はそろそろ頭打ち? “札束で殴り合う”開発競争の最前線に暗雲がただよう3つの理由
news.yahoo.co.jp/articles/f4174abca2699ccc1f7a11ef2332a1a2a1c8c518
2025/02/18(火) 12:53:52.71ID:wg5VOJpA
エッチな画像を簡単に制限なく作成できるものありますか?🥳
2025/02/18(火) 12:54:19.06ID:rJfTbFzx
結局無料で仕事にも使える賢い子ってchatgptしかないの?
2025/02/18(火) 13:03:23.14ID:BSmVY7AD
xAIライブ
x.com/xai/status/1891699715298730482
2025/02/18(火) 13:09:49.73ID:lITndnL1
>>904
えっ、完全無料って4o miniだけだぞ
2025/02/18(火) 13:34:50.82ID:/WZgM3g0
シンギュラリティが近いな
2025/02/18(火) 13:38:50.25ID:/WZgM3g0
やっぱイーロンの一存でGPUぶっ込めるのは強いな
GPUこそパワーか
2025/02/18(火) 13:43:45.68ID:lITndnL1
4o miniってファイル添付すらできないよね
だからGeminiやらPerplexityやらリートンやら使い分ける必要があるわけで
910名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 13:51:30.34ID:0l0Lb0F1
Geminiは馬鹿すぎて
デマサイトをソースにした糞デマ回答ばかり
2025/02/18(火) 13:51:44.80ID:fJJuWlbQ
なんかgrok3微妙そうだな
あまり期待はしてなかったけど
2025/02/18(火) 13:58:59.60ID:ta6t1fBi
どことなくopenai意識してるライブだったな
2025/02/18(火) 14:08:35.61ID:XC0Tys2N
今スマホアプリだとpro契約できない?
2025/02/18(火) 14:11:27.62ID:7qQ2LnaV
grok3全く期待してなかったから意外と良さそうと思ってしまった
少なくともgeminiは超えそう
2025/02/18(火) 14:15:15.44ID:XC0Tys2N
自決した
一回plus買ったら出てくるのか
916名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:23:02.09ID:oRHOAn5m
Grok3作ってる人DeepSeek製作者と同じ大学出身なんだな
917名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:23:37.81ID:wr02jwsZ
>>915
成仏してくれ
2025/02/18(火) 14:23:44.68ID:tMmjgle4
ベンチマークにo1プロないけどさすがに負けた?
919名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:31:04.83ID:RnSaSjaq
え?有料プランじゃないと使えんの?
2025/02/18(火) 14:31:18.01ID:fJJuWlbQ
ベンチマークの比較対象にOpenAI入れてないしDeepSeek R1ではなくV3どの比較ってのが
921名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:39:39.85ID:oRHOAn5m
>>920
o3とR1の比較もあるよ
どちらも超えてる
922名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:42:38.61ID:WKbQ/tIN
>>921
o3じゃなくてo3-mini-highとの比較でしょ
現状フルのo3に勝てるモデルはまだないんじゃ
2025/02/18(火) 14:48:12.27ID:7qQ2LnaV
公開されてないものと比較しろと言われても
2025/02/18(火) 14:54:54.76ID:AxO+NSWu
ベンチマーク見る限り推論でo3-mini-highを余裕で超えてるしo3級かも
925名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:54:55.43ID:ag4aleyF
Grok3

Chatbot Arena
https://pbs.twimg.com/media/GkCwmF8XsAAmpIp.jpg

AIME'24, GPQA, LCB Oct-Feb
https://pbs.twimg.com/media/GkCwE8UXoAECOvW.jpg

Reasoni + Test-Time Compute
https://pbs.twimg.com/media/GkC4AwVaAAIxNFd.jpg
926名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 14:56:10.96ID:oRHOAn5m
Gemini 2.0 pro超えた上で推論載ってるから現状本当に最強だね

s://i.imgur.com/sOYoXK4.jpeg
927名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:01:52.45ID:ag4aleyF
Andrej Karpathyの詳細な評価
https://poe.com/s/USent9O34IxwzlhdDKV7
928名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:05:05.97ID:ag4aleyF
FrontierMath, Humanity's Last Exam, ARC AGIなど高難度のベンチはまだ無し
929名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:10:49.78ID:ag4aleyF
Grokスタンドアロン版で使用可能
https://pbs.twimg.com/media/GkDFrRiWEAArJLQ.jpg
930名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:13:58.19ID:ag4aleyF
料金プラン等まとまった説明↓
https://x.com/AGI_to_ASI/status/1891725049834635352
2025/02/18(火) 15:30:50.00ID:/WZgM3g0
o1 proが1/10の値段で使えるようになった
ぐらいに考えるのが正解かな
Deep Reserchの分だけまだアドバンテージが残るか
2025/02/18(火) 15:35:46.13ID:ta6t1fBi
次スレはもうDeepseek外していいんじゃない
利用されるポテンシャルはGrokの方がありそう
2025/02/18(火) 15:39:10.53ID:/WZgM3g0
強化学習とGPUぶん回しだけでまだ数年行けそうなのが凄い
マジで国家予算ぶち込んで作ってくれよ
GPU類回収令を出すべき
2025/02/18(火) 15:39:29.11ID:RZhL8Nad
前スレまでもう一つあった気がするけどまあいいか
935名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:45:32.07ID:ag4aleyF
>>643
事前トレーニングのスケーリング則も続いていることを示したと言っていいだろう

>>148
AIリスク管理は後回しだったけど、さすがにこの短期間の性能向上でリスク管理完全無視はまずいと思ったか
936名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 15:52:53.86ID:RnSaSjaq
は?有料のみ?
もう投資回収モードかよ
無料ですらほとんど利用されてなかったのに有料とかAI驚き屋しか使わねえwq
2025/02/18(火) 16:00:11.89ID:SiMaaYFL
よう貧乏人
2025/02/18(火) 16:00:45.55ID:MgsM5FiR
アマプラと一緒で色々ある有料特典の一つでしかないのだろう>Grok3
939名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:04:41.22ID:8LewtQG3
スレタイに入れるのはさすがに気が早い
もっと注目が集まってからでいいよ
あと入ってないけどCopilotはClaudeと同じぐらい
https://i.imgur.com/F2Up79I.png
2025/02/18(火) 16:09:36.37ID:0kocvveb
>>902
>「戦闘機に竹槍で挑む」ようなAI研究開発の力の差

悲しいなぁ
2025/02/18(火) 16:10:32.51ID:lITndnL1
そもそもXを使わないからGrokなにそれ?って感じだが
942名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:13:31.93ID:6nNKR9FL
grok.comがあるからXアカウントは必須じゃなくなったけどな
2025/02/18(火) 16:23:46.87ID:7qQ2LnaV
Xの方は使えてるらしいけどgrok.comはまだみたい?
はよせえや
2025/02/18(火) 16:26:03.08ID:tMmjgle4
SNSと組み合わさってることがあまり活かされてないよね
ポスト分析してプロフィールに出すのは面白いけどそれくらい
945名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:29:14.48ID:Jl0xGbJp
さっきプレミアムクラス課金したばかりだけどiOSアプリだともうGrok3使える

PCとXからはまだGrok2
946名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:37:21.95ID:WKbQ/tIN
Xプレミアムプラスに課金したXアカウントでサインインしたらgrok.comにもGrok3が降ってきた
2025/02/18(火) 16:43:29.34ID:lITndnL1
有料なら使わんな
948名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:44:08.56ID:fRzTStHi
イーロンやべえー
昨日の発言半笑いで聞いてたのに本当に世界トップレベルのモデルでGrok出してきやがった
俺は世界一の実業家を舐めすぎていたようだ
2025/02/18(火) 16:44:46.74ID:7qQ2LnaV
おいおい今日中じゃなかったんかい
向こうはもうすぐ日付変わるぞ
2025/02/18(火) 16:50:27.38ID:lITndnL1
__Grok3、13時から実況スレ [827565401]
greta.5ch.net/test/read.cgi/poverty/1739836554/

伸びてなくて草
951名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:51:54.79ID:Jl0xGbJp
>>947
o1 pro超えたAIが2500円で使えるから破格だよ
952名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:53:30.18ID:OMBx+zGi
>>950
パンピーはまだChatGPTの名前しか知らんレベルだろ
953名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 16:54:47.36ID:Jl0xGbJp
>>950
90万人視聴してたのにまた日本は世界から置いてかれてしまうね…
954名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:00:54.40ID:OMBx+zGi
そういや先週あたりに「アリーナのチョコレートってモデルがやたら頭良い」って報告してた人いたな
あれの正体Grok3だったみたいだ 見る目あったな
955名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:05:21.00ID:1wzN5VlP
>>57
チョコレート
2025/02/18(火) 17:05:23.66ID:+8pIRwdv
>>951
o1 proは10万字出力できるそうだけど、Grok3もできるのか?
使える人試してみて
957名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:06:53.01ID:Jl0xGbJp
>>956
自分の環境だとDepo Researchとか解放されてないからまだ試せない

もう解禁されてる人はいるから解禁されたら後で試すよ
2025/02/18(火) 17:09:18.29ID:CXQZ5i1f
無課金乞食ユーザーだけどDeepSeekタイムアウトおおすぎんよ
959名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:12:07.32ID:acjhJa5y
Grok3のベンチにo3も加えたもの
まあo3単独のリリースはなくなったんだが
pbs.twimg.com/media/GkDAGFPagAAmsM9.jpg
作ったのはOpenAI社員w
2025/02/18(火) 17:12:17.48ID:+8pIRwdv
>>957
楽しみにしてます
2025/02/18(火) 17:15:12.69ID:EpLA1aab
>>940
戦闘機と竹槍程度の力量差だったらまだええけどなあ
実際は戦艦と丸腰のボートぐらいやと思う……
武器すらないのが日本なんだ……
2025/02/18(火) 17:15:41.83ID:R0gvQoOQ
gemini,microsoftのcopilotって課金したら
回答正しくなるんかなあ
無料だといずれも大正駅が御堂筋線の駅になってる
2025/02/18(火) 17:16:00.68ID:/WZgM3g0
miniとかproとかいい加減まとめてくれと
964名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:16:00.68ID:acjhJa5y
grok3-miniは全ユーザーに提供予定

@archanfel_anoth
Excited to be a member of the amazing team at @xai , and shipping the best grok3!

Thrilled to lead grok3-mini training, and will ship it to all users for free in the coming days! LFG!
965名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:17:59.03ID:acjhJa5y
サム「我々もモデル選択画面が嫌いです」
2025/02/18(火) 17:22:43.36ID:lITndnL1
>>958
Flash Thinkingでいいよ
推論モデルの中では最速最軽量だし
967名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:25:09.68ID:oRHOAn5m
OpenAIがCloseAIになった日
2025/02/18(火) 17:27:12.08ID:/WZgM3g0
今度はTest Time Computeまで追加してきやがって
TTC Resoning Pro mini(high) Flash Thinking Betaとか出てくるのか
969名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:30:55.78ID:Jl0xGbJp
最上位のプラン含めても8000円だからGPTより安いね
970名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:37:03.09ID:acjhJa5y
Grok 3
Grok 3 mini
Grok 3 Reasoning
Grok 3 Reasoning mini
DeepSearch
SuperGrok

たくさんあるな
2025/02/18(火) 17:46:23.17ID:U/sVJ5rX
GPT-4oより高性能うたう「Grok 3」マスク氏のxAIがリリース。ウェブ版とiOSアプリ版で提供
news.yahoo.co.jp/articles/0d8aefd5df7dfb822bf571e412c3f472618bb729
972名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:47:01.01ID:RnSaSjaq
>>964
miniかよショボいなぁ
イーロンマスクは本気でchatgpt超えるつもりあるんか
上位モデル制限して爆死してるgeminiやclaude見てないんか
973名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:48:00.82ID:4SvKKUYQ
日本語記事今回は早かったな
www.itmedia.co.jp/news/spv/2502/18/news138.html
974名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 17:48:12.09ID:4SvKKUYQ
これも
pc.watch.impress.co.jp/docs/news/1663782.html
2025/02/18(火) 17:55:50.53ID:dMUfzz/a
Grok3のdeep searchが気になるな。OpenAIのDeep Researchと比較みてみたい
2025/02/18(火) 18:00:49.00ID:7qQ2LnaV
出力はo1 proと遜色ないけどdeepresearchもどきは明確に及ばないって誰かが言ってた気がする
977名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:02:15.90ID:RpIUc8Jt
ツイッターってインプレ数で収入化でインプレゾンビだらけになったけど
そのせいでコピペ乞食やフェイクで誹謗中傷しやすい状況になってSNSとして質が落ちてるけど
インプレ収入化やめないのかね
AIに学習させる価値もないだろ
978名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:05:08.91ID:hgEaixzg
これから、どこかが新モデル出すたびにトップが入れ替わって、入れ替わりの速度自体も加速するんだろうな
2025/02/18(火) 18:07:56.71ID:dMUfzz/a
Anthropicももうそろそろ出すって噂だったよな。
推論はできるようになるんだろうが、検索はどうなるかな。
2025/02/18(火) 18:09:05.30ID:UhG75q8X
>>975
Grok3の「Deep Search」とOpenAIの「Deep Research」は、いずれも高度なAIリサーチ機能を提供するエージェントですが、その特徴や機能にはいくつかの違いがあります。以下に詳細を比較します。

1. Grok3のDeep Search
イーロン・マスク氏が率いるxAIが開発したGrok3は、最新の推論モデル「o1」を超える性能を持つとされています。このモデルは、AIME 2025などの一般的なAIベンチマークで、OpenAIの「o3-mini-high」を上回る性能を示しています。 Grok3は、ユーザーの質問に対してインターネットとX(旧Twitter)を検索し、得られた情報を分析して要約を提供する「Deep Search」機能を備えています。この機能により、ユーザーは最新の情報を迅速に取得できます。

2. OpenAIのDeep Research
OpenAIが提供する「Deep Research」は、最新モデル「o3」を基盤としたAIエージェントです。このエージェントは、ウェブ閲覧、Python実行環境、画像・PDF解析ツールなどを統合し、複数の情報源からデータを収集・分析して包括的なリサーチレポートを生成します。 特に、金融、科学、政策、エンジニアリングなどの分野での詳細な調査に役立ちます。レポートには参照元が明記され、情報の信頼性を確認しやすくなっています。ただし、現在はProプランのユーザーのみが利用可能で、無料ユーザーには月2回の利用が提供されています。
2025/02/18(火) 18:09:14.73ID:UhG75q8X
>>980の続き

3. 比較まとめ
・情報源と検索範囲: Grok3のDeep SearchはインターネットとXを主な情報源とし、リアルタイムの情報収集に優れています。一方、OpenAIのDeep Researchはウェブ全体を対象とし、より広範な情報収集と多段階の分析が可能です。
・機能とツールの統合: Deep Researchは、ウェブ閲覧だけでなく、Pythonによるデータ解析や画像・PDFの解析など、多様なツールを統合しています。これにより、データの深い分析や視覚化が可能です。Grok3のDeep Searchは主に情報の検索と要約に焦点を当てています。
・利用可能性とコスト: Deep Researchは現在、Proプランのユーザーに提供されており、無料ユーザーには月2回の利用が許可されています。 Grok3のDeep Searchに関する具体的な利用条件やコストに関する情報は限られていますが、Premium Plus加入者が利用可能との情報もあります。

総じて、Grok3のDeep Searchは迅速な情報収集と要約に特化しており、OpenAIのDeep Researchは多機能で包括的なリサーチとデータ解析を提供します。利用目的や必要とする機能に応じて、適切なエージェントを選択することが重要です。
2025/02/18(火) 18:11:22.18ID:s4gti72i
APIはよ🥺
983名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:11:55.23ID:dKmaWWSP
Claudeはpaprikaか
ちなみにClaude関係のコードネームは香辛料
これ豆な
984名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:16:47.40ID:OMBx+zGi
>>983
ありがたい情報
985名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:17:10.94ID:UVmsiduI
Claudeは3.5 Sonnetが<antThinking>タグで回答前に簡易的な思考をしてるから、新しい推論モデルはそれの発展型だろうな
2025/02/18(火) 18:17:27.51ID:Cgjsih1U
o1 pro程度だとすればベンチマークにo1 proがない違和感も辻褄合うな
Deep Research便利過ぎるしOpenAIのままで良いかな
2025/02/18(火) 18:34:39.28ID:qbFElDRC
PCブラウザ版GPT
「おかしいだろ!」はOK
「なめてんのか!!」もOK
「おかしいだろ!なめてんのか!!」にした途端暴言と判断されるみたいで「コンテンツが削除されました」って表示されるのなぞこわ
988名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:42:21.88ID:wr02jwsZ
GrokがO3相当って言われてもふーんとしか感じないのは感覚バグってんのかな
はよAGI来いとしか思わん
989名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:43:35.54ID:UVmsiduI
@elonmusk
Unhinged funny Grok coming tomorrow
2025/02/18(火) 18:43:36.70ID:7qQ2LnaV
AGIなんて月面着陸みたいな一般人には関係ない話だろ?
なんでそんなもん待ちわびてんの
2025/02/18(火) 18:43:42.43ID:XC0Tys2N
株マンとしてはXからの情報抽出できるの結構ありがてえ
992名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:46:35.51ID:RM76pScp
【ChatGPT】AIチャット総合 33【DeepSeek・Gemini】
https://mevius.5ch.net/test/read.cgi/esite/1739871879/
993名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 18:46:59.35ID:RM76pScp
スレタイはまた次スレ終盤に考えるということで
2025/02/18(火) 18:57:06.90ID:lITndnL1
本当に無料でFlash Thinking超えというならGoogle涙目なんだがな
でもあくまでExperimentalなんだよな
Googleはもっと完璧なものを仕上げてくるはずだ
995名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 19:12:18.53ID:qLcAyB3Y
>>989
イーロンこういうの好きだよね
996名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 19:25:20.70ID:RnSaSjaq
997名無しさん@お腹いっぱい。
垢版 |
2025/02/18(火) 19:29:40.03ID:VvQ+2Aqy
先に埋めずに次スレに書くバカチンが!
2025/02/18(火) 19:34:01.61ID:ID1hUXVm
メタもLlamaを「Meta AI」としてフェイスブックやインスタグラムに統合してるんだね?
日本では使えないみたいだけど
2025/02/18(火) 19:35:14.84ID:VWPcVEV9
>>991
風説で踊らされまくる未来が見える。
2025/02/18(火) 19:36:35.79ID:ID1hUXVm
Gro3kは、DeepSeekが出て他社が動揺していても、予定通りリリースするとイーロンがXで言ってたし
どこまで先を見通してるんだろうな?
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 8日 7時間 22分 32秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。

▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/

▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況