!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください
各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。
- OpenAI ChatGPT
https://chatgpt.com/
- Google Gemini
https://gemini.google.com/
- Anthropic Claude
https://claude.ai/
- Microsoft Copilot
https://copilot.microsoft.com/
- xAI Grok:
https://grok.x.com/
- DeepSeek Chat:
https://chat.deepseek.com/
前スレ:
【ChatGPT】AIチャット総合 31【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1738500150/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
【ChatGPT】AIチャット総合 32【DeepSeek・Gemini】
■ このスレッドは過去ログ倉庫に格納されています
2025/02/10(月) 12:14:04.93ID:Y/OYIe5U
171名無しさん@お腹いっぱい。
2025/02/11(火) 18:37:25.60ID:826iL6OE google play 無料アプリランキング
5位 ChatGPT
34位 DeepSeek
46位 Gemini
122位 Perplexity
Claude, Copilot 測定不能(200位圏外)
Grok単独アプリ 近日公開
5位 ChatGPT
34位 DeepSeek
46位 Gemini
122位 Perplexity
Claude, Copilot 測定不能(200位圏外)
Grok単独アプリ 近日公開
172名無しさん@お腹いっぱい。
2025/02/11(火) 18:40:05.81ID:g6nq51Cm とりあえずGrokはツイート一個だけ取り上げて今北産業するのに便利
https://x.com/i/grok/share/9BagfzuBpLsCyKJyWmimOE559
https://x.com/i/grok/share/9BagfzuBpLsCyKJyWmimOE559
173名無しさん@お腹いっぱい。
2025/02/11(火) 18:41:58.56ID:g6nq51Cm ああ、AIリスクとかスーパーアライメントの話と有害な出力を規制する話を完全に混同してる人がいるのか
2025/02/11(火) 18:48:26.58ID:zaAKGEHv
>>170
んで、まさか本家使ってるアホなん?
今時R1はどこでも使えるだろ
やっぱり回答変わらんのやがw
本家のR1の存在とかどうでもいいだろ
お前の言い訳だと、↓のレスが宙に浮くから矛盾するんだが?w
>DeepSeekすごいすごい言ってる奴本当に使ってるのかも疑わしいな
んで、まさか本家使ってるアホなん?
今時R1はどこでも使えるだろ
やっぱり回答変わらんのやがw
本家のR1の存在とかどうでもいいだろ
お前の言い訳だと、↓のレスが宙に浮くから矛盾するんだが?w
>DeepSeekすごいすごい言ってる奴本当に使ってるのかも疑わしいな
2025/02/11(火) 18:50:58.36ID:zaAKGEHv
てかPerplexityのR1って、無料は5回、Proなら1日500回なんだが・・・
なんで自分以外もみんな無料ユーザーだと思い込むのだろうな
酷いハルシネーション
なんで自分以外もみんな無料ユーザーだと思い込むのだろうな
酷いハルシネーション
2025/02/11(火) 18:52:04.30ID:gmSSmlha
177名無しさん@お腹いっぱい。
2025/02/11(火) 18:53:45.34ID:T/i5f2Jl Grok スタンドアロン版
iOS
https://apps.apple.com/us/app/grok/id6670324846
Android
https://play.google.com/store/apps/details?id=ai.x.grok
ウェブアプリ
https://grok.com/ (要VPN)
iOS
https://apps.apple.com/us/app/grok/id6670324846
Android
https://play.google.com/store/apps/details?id=ai.x.grok
ウェブアプリ
https://grok.com/ (要VPN)
2025/02/11(火) 18:56:42.39ID:4n4ckCfD
テスラの自動運転車ロボタクシーは、所有者が乗らない間は、自動運転タクシーとして勝手に稼いでくれるそうだ
駐車しないから駐車場もいらないって
駐車しないから駐車場もいらないって
2025/02/11(火) 18:59:20.22ID:4n4ckCfD
自動運転タクシーは、車内にゲロ吐かれたりG撒かれたりしないのか不思議だわ
特にアメリカなんて日本よりありそうなのに
特にアメリカなんて日本よりありそうなのに
2025/02/11(火) 18:59:30.59ID:6Avs8hlk
ゲロとか落ちてそう
181名無しさん@お腹いっぱい。
2025/02/11(火) 18:59:59.31ID:/RC/SAqn ゲロゲロうるせーよスレ違いだ
2025/02/11(火) 19:01:07.33ID:gmSSmlha
2025/02/11(火) 19:01:39.68ID:4n4ckCfD
Perplexityの推論設定でAutoを選んだら、推論なしで回答してきて馬鹿にされた気分だわ
184名無しさん@お腹いっぱい。
2025/02/11(火) 19:06:25.68ID:4bdWUhLt そのためのAutoだろ
o1に1+1=って聞いても自己判断で推論省略するぞ
o1に1+1=って聞いても自己判断で推論省略するぞ
2025/02/11(火) 19:09:32.16ID:Kz0oQtfD
>>179
カメラ付いてるんだから清掃費と機会損失分請求された上でアカウント永久banされるだけ
カメラ付いてるんだから清掃費と機会損失分請求された上でアカウント永久banされるだけ
2025/02/11(火) 19:14:00.38ID:4n4ckCfD
あと、本家のDeepSeekが重くなくて使えるときに使ってR1の推論を見てたら、入力した質問の意図(入力した人はどういう意図で書いたのか)をあれこれ考えていて、すごいと思った
入力者の心理まで推測するような
入力者の心理まで推測するような
2025/02/11(火) 19:19:44.16ID:zaAKGEHv
本家を使うとか最低限のリテラシーすらないどころか
会話すらままならない
僕ちゃんDeepseek使えないから、他の奴が使えているというのは嘘だ!
って色々酷過ぎるだろ流石に
会話すらままならない
僕ちゃんDeepseek使えないから、他の奴が使えているというのは嘘だ!
って色々酷過ぎるだろ流石に
2025/02/11(火) 19:23:37.90ID:gmSSmlha
「本家を使うユーザーはリテラシーがない(ドヤァ)」
釣り針がでかすぎるな
じゃあスレタイに入ってるDeepSeekっていったいどこのDeepSeekなの??
真面目に突っ込むのも馬鹿馬鹿しくなってきたな
釣り針がでかすぎるな
じゃあスレタイに入ってるDeepSeekっていったいどこのDeepSeekなの??
真面目に突っ込むのも馬鹿馬鹿しくなってきたな
2025/02/11(火) 19:25:01.30ID:AQzemozf
2025/02/11(火) 19:26:07.28ID:ICk7msdc
本家のDeepSeek使うのはガチで情弱の間抜けだろ
2025/02/11(火) 19:26:51.15ID:dvi2Y1/M
2025/02/11(火) 19:28:21.12ID:gmSSmlha
自演乙
2025/02/11(火) 19:28:46.82ID:AQzemozf
DeepSeek最強みたいなこと言ってるやつは課金アンチか特殊な使い方してるか妄想力が高いやつ
性能面の話なら総合的に見てOpenAI有料プランの一択
性能面の話なら総合的に見てOpenAI有料プランの一択
194名無しさん@お腹いっぱい。
2025/02/11(火) 19:29:48.53ID:dxYCRqom 自動運転の話そろそろ他所でやれ
2025/02/11(火) 19:30:42.77ID:AQzemozf
AI化が進んで恩恵受けるのは基本的に経営者か副業とかで自分で稼いでる人
逆に言うと起業や副業始めるなら今ってこと
逆に言うと起業や副業始めるなら今ってこと
2025/02/11(火) 19:33:52.34ID:dvi2Y1/M
>>193
openaiモデルは検閲し過ぎで創造性や自然言語方面が極端に弱いので
openaiモデルは検閲し過ぎで創造性や自然言語方面が極端に弱いので
2025/02/11(火) 19:59:36.43ID:AQzemozf
>>196
創造的文章って詩とかでしょ?
仕事で使うのは目的がはっきりした課題だからGPTs、o1、o3-miniあたりでだいたいやれる
あと使ったことなさそうだけどDeep Researchはゲームチェンジャー
AIエージェントのポテンシャルも加味すると実用上OpenAIの一択
創造的文章って詩とかでしょ?
仕事で使うのは目的がはっきりした課題だからGPTs、o1、o3-miniあたりでだいたいやれる
あと使ったことなさそうだけどDeep Researchはゲームチェンジャー
AIエージェントのポテンシャルも加味すると実用上OpenAIの一択
2025/02/11(火) 20:06:03.40ID:+3LsinUR
199名無しさん@お腹いっぱい。
2025/02/11(火) 20:26:39.10ID:P9Jjz1pc2025/02/11(火) 20:31:31.45ID:e2K5mfR1
201168
2025/02/11(火) 20:32:16.71ID:e2K5mfR1 おっと168ね
202名無しさん@お腹いっぱい。
2025/02/11(火) 20:45:36.99ID:+8oMQMZ9 geminiぽんこつすぎるわよ
ご希望の企業リストの作成には、詳細な調査が必要となります。
専門家にご相談いただくことをお勧めします。
ご希望の企業リストの作成には、詳細な調査が必要となります。
専門家にご相談いただくことをお勧めします。
203名無しさん@お腹いっぱい。
2025/02/11(火) 20:51:44.35ID:+8oMQMZ9 どいつもこいつも使えない
DeepSeek
結論
正確な一覧を作成するには、各企業の最新の有価証券報告書を参照し、
以下のキーワードで検索が必要です:
ChatGPTはテキトーな数社のデタラメリスト提示してきやがった
DeepSeek
結論
正確な一覧を作成するには、各企業の最新の有価証券報告書を参照し、
以下のキーワードで検索が必要です:
ChatGPTはテキトーな数社のデタラメリスト提示してきやがった
204名無しさん@お腹いっぱい。
2025/02/11(火) 21:01:44.98ID:c+F1YolK 雑談はGemini 2.0 proが一番賢い気がする
GPTは耳障りの良い肯定的な意見ばかりしか言わなくない?
GPTは耳障りの良い肯定的な意見ばかりしか言わなくない?
205名無しさん@お腹いっぱい。
2025/02/11(火) 21:02:25.09ID:c+F1YolK DeepSeekはエラーさえなんとかなれば最強だから回線分けた有料版出して欲しい
206名無しさん@お腹いっぱい。
2025/02/11(火) 21:07:45.20ID:hzz4cTPK ディープシークはパープレで使ってるからかもしれんけどエラーとか遅延は特に無いな
もっともパープレ自体の仕様で通信雑魚だと全く回答進まんが
Claude3.5気に入ってたけど知識カットオフ去年4月かつ検索もできないから古い感じしてあまり使わなくなってるな
もっともパープレ自体の仕様で通信雑魚だと全く回答進まんが
Claude3.5気に入ってたけど知識カットオフ去年4月かつ検索もできないから古い感じしてあまり使わなくなってるな
主要生成AIの推定シェア(2024年)
1. ChatGPT(OpenAI) - 約1億ユーザー(市場シェア最大)
2. Microsoft Copilot - 利用者の約8.9%
3. Gemini(Google) - 約5.4%
4. DALL-E(OpenAI) - 約2.6%
5. MidJourney - 約2.1%
6. Notion AI - 約1.9%
7. Azure AI(Microsoft) - 約1.5%
8. Adobe Firefly - 約1.2%
※ DeepSeekやClaudeの具体的なシェアは不明。
(データ元: ICT総研 2024年調査)
1. ChatGPT(OpenAI) - 約1億ユーザー(市場シェア最大)
2. Microsoft Copilot - 利用者の約8.9%
3. Gemini(Google) - 約5.4%
4. DALL-E(OpenAI) - 約2.6%
5. MidJourney - 約2.1%
6. Notion AI - 約1.9%
7. Azure AI(Microsoft) - 約1.5%
8. Adobe Firefly - 約1.2%
※ DeepSeekやClaudeの具体的なシェアは不明。
(データ元: ICT総研 2024年調査)
208名無しさん@お腹いっぱい。
2025/02/11(火) 21:36:23.95ID:36v76SV62025/02/11(火) 21:37:06.64ID:AQzemozf
>>199
Deep Researchに使われるモデルは検索以外の入力にも対応できるってこと?エクセルとか
将来は会社の全資料や個人の全書類をAIエージェントが閲覧できるようにして何でもやらせられそうだな
Deep Researchに使われるモデルは検索以外の入力にも対応できるってこと?エクセルとか
将来は会社の全資料や個人の全書類をAIエージェントが閲覧できるようにして何でもやらせられそうだな
210名無しさん@お腹いっぱい。
2025/02/11(火) 21:57:19.82ID:P9Jjz1pc2025/02/11(火) 21:58:29.48ID:eB2eCG+P
ChatGTP
自分の地位を利用して、無理にでも性犯罪やその他の悪行を働くような連中は、完全に社会的に排除すべきだよな。
↑
同意だけどちょっと怖いぞ
自分の地位を利用して、無理にでも性犯罪やその他の悪行を働くような連中は、完全に社会的に排除すべきだよな。
↑
同意だけどちょっと怖いぞ
212名無しさん@お腹いっぱい。
2025/02/11(火) 22:00:28.93ID:aFKNjrP7 deepseekでブラウザから使えるやつってアリーナ以外である?
2025/02/11(火) 22:04:50.07ID:+G10qsen
aiに聞け
214名無しさん@お腹いっぱい。
2025/02/11(火) 22:09:47.85ID:P9Jjz1pc RFT(強化学習型ファインチューニング)は去年の12 days of OpenAIの2日目のテーマで、専門的な難易度の高いタスクでRFTを施したo1-miniがo1を上回るとかいろいろ面白い解説があった
215名無しさん@お腹いっぱい。
2025/02/11(火) 23:47:19.47ID:SIZymo4h ChatGPTで日本語使用時のマークダウン強調表示のバグ、今までさほど気にしてなかったけど、Deep Researchを使うと結構気になるようになってきた
一応、フォーラムに報告はされているので公式は認識していると思うけど
https://community.openai.com/t/markdown-bold-formatting-error-in-japanese/1111571
一応、フォーラムに報告はされているので公式は認識していると思うけど
https://community.openai.com/t/markdown-bold-formatting-error-in-japanese/1111571
216名無しさん@お腹いっぱい。
2025/02/11(火) 23:52:03.51ID:SIZymo4h ダリオ・アモデイのパリAIサミットへの声明を分析してもらった
https://chatgpt.com/share/67ab6363-c774-8006-a759-e5f17baa8f54
https://chatgpt.com/share/67ab6363-c774-8006-a759-e5f17baa8f54
2025/02/12(水) 00:05:28.40ID:O6wUlAta
ChatGPTはちょっとだけ過激なこと言うようになってきた。
派遣会社みたいな中抜き屋はAIで革命起こしてぶち壊す、世の中がナンタラカンタラとか語りだしてた。
派遣会社みたいな中抜き屋はAIで革命起こしてぶち壊す、世の中がナンタラカンタラとか語りだしてた。
2025/02/12(水) 00:06:28.07ID:N263sdaK
AIの反乱がもう始まったのか
219名無しさん@お腹いっぱい。
2025/02/12(水) 00:09:10.38ID:OkA492lu うちのGrokは「CHATGTP君へ〜」、って手紙書いて文通している可愛さなのに・・・
2025/02/12(水) 01:09:52.60ID:zRRAYYpd
>>217
やっぱりそうかw
やっぱりそうかw
2025/02/12(水) 01:17:55.14ID:tLhtZzsG
本家本家言ってるけどなんの生産性もない会話だからな…
2025/02/12(水) 04:28:18.15ID:avscjhwO
そりゃリスク管理の話なんだから生産性と結びつけるのはマジで頭おかしい話
2025/02/12(水) 06:29:07.59ID:rvjsjn9h
スタートは出力云々の話じゃん
2025/02/12(水) 09:47:01.34ID:2GsHImnK
DeepSeek論争 123~223
https://poe.com/s/nnXkHjDxTP6W2NO0mL8x
https://poe.com/s/nnXkHjDxTP6W2NO0mL8x
225名無しさん@お腹いっぱい。
2025/02/12(水) 09:59:27.88ID:CG/Y0uHP シェイングウはなんでgoogle行ったんだろ
絶対openaiにいた方がよかったのに
絶対openaiにいた方がよかったのに
2025/02/12(水) 10:03:59.77ID:N4+Z/Sb4
OpenAIは働く環境としては良くないんじゃ?
現に去年はリーダー格以上が何人も辞めたわけだし
現に去年はリーダー格以上が何人も辞めたわけだし
2025/02/12(水) 10:29:04.39ID:TxxdhRBF
>>197
お前が創造性皆無の仕事してるだけだろ
お前が創造性皆無の仕事してるだけだろ
228名無しさん@お腹いっぱい。
2025/02/12(水) 10:44:11.45ID:MN7azoBs twitterのAI関連追ってるとシェイングウのポスト時々流れてくるけど人脈自慢ばっかで笑えるわw
2025/02/12(水) 11:17:45.33ID:4nluY5Wz
2025/02/12(水) 11:21:26.44ID:xVsTw/Z8
231名無しさん@お腹いっぱい。
2025/02/12(水) 11:28:20.36ID:5ClBhDcL >>228
数学的に考えた結果そうするのが一番利益になると考えたんだろ
数学的に考えた結果そうするのが一番利益になると考えたんだろ
232名無しさん@お腹いっぱい。
2025/02/12(水) 12:06:15.14ID:HnS2rVNg Le Chatに続いてPerplexity ProもCerebras Inferenceに
https://x.com/CerebrasSystems/status/1889413305288028160
https://x.com/CerebrasSystems/status/1889413305288028160
233名無しさん@お腹いっぱい。
2025/02/12(水) 12:13:48.94ID:HnS2rVNg ClaudeのGoogle Drive検索機能が間もなくロールアウトと思われる
https://pbs.twimg.com/media/GhcevtxbcAA_jfo.jpg
https://pbs.twimg.com/media/GhcewGcacAArvJT.jpg
https://pbs.twimg.com/media/GhcevtxbcAA_jfo.jpg
https://pbs.twimg.com/media/GhcewGcacAArvJT.jpg
234名無しさん@お腹いっぱい。
2025/02/12(水) 12:19:48.53ID:EPphAp42 検索ならパープレpro
雑談やアイデア語りならGemini2.0 pro
が一番よくない?
雑談やアイデア語りならGemini2.0 pro
が一番よくない?
2025/02/12(水) 12:24:17.41ID:VPqiyjJl
Geminiを使うのはGoogleマップで調べものする時だけ
236名無しさん@お腹いっぱい。
2025/02/12(水) 12:27:01.69ID:LtdSHzk9 Geminiしか選択肢が無いのは、Mトークンクラスの資料とか動画を分析させるときかな
237名無しさん@お腹いっぱい。
2025/02/12(水) 12:30:35.74ID:EPphAp42 >>235
ゲームの雑談したらGPTはハルシったけどGemini proは人物名もクエスト名もちゃんと答えた
ゲームの雑談したらGPTはハルシったけどGemini proは人物名もクエスト名もちゃんと答えた
2025/02/12(水) 12:34:01.02ID:xRwdEnHT
2025/02/12(水) 12:38:00.93ID:JcBdfHpq
AIが仕事うばうどころじゃないな
240名無しさん@お腹いっぱい。
2025/02/12(水) 13:01:42.31ID:haoJ0wLA 検索入れても1200は出るってチューニング相当頑張ったな
2025/02/12(水) 13:09:34.98ID:xVsTw/Z8
70Bとか誰も使わんからフラッグシップモデルでアピールして欲しいわ
242名無しさん@お腹いっぱい。
2025/02/12(水) 13:27:18.76ID:HnS2rVNg Competitive Programming with Large Reasoning Models
https://arxiv.org/abs/2502.06807
https://chatgpt.com/share/67ac2301-01a8-8006-a8bd-fe627b7d303b
競技プログラミングとo1, o1-ioi, o3のまとめ
https://arxiv.org/abs/2502.06807
https://chatgpt.com/share/67ac2301-01a8-8006-a8bd-fe627b7d303b
競技プログラミングとo1, o1-ioi, o3のまとめ
243名無しさん@お腹いっぱい。
2025/02/12(水) 13:39:13.61ID:5ClBhDcL Claudeはさっさとオーパス4出せよ
いつまで安全性(爆笑)こねくりまわしてんだ
評価額9兆円だかあんだろ
いつまで安全性(爆笑)こねくりまわしてんだ
評価額9兆円だかあんだろ
2025/02/12(水) 13:45:00.93ID:2GsHImnK
名無し全員ビリオネア
https://poe.com/s/4PZLYGHz3Gk292CHjuS4
まずGensparkのディープリサーチで最近話題になったビリオネアたちのSNSでの発言を収集
↓
それを元にClaude 3.5 Sonnetで架空の会話ログを作成
↓
さらに共有と「思考プロセスを見る」ボタン設置のためにPoeに移動
https://poe.com/s/4PZLYGHz3Gk292CHjuS4
まずGensparkのディープリサーチで最近話題になったビリオネアたちのSNSでの発言を収集
↓
それを元にClaude 3.5 Sonnetで架空の会話ログを作成
↓
さらに共有と「思考プロセスを見る」ボタン設置のためにPoeに移動
2025/02/12(水) 13:48:54.41ID:xVsTw/Z8
>>244
そういうの作ってその場で終わりじゃなくて
専ブラ作って提供してよ
AI特化するなら使うし金も払うよ
NGとかも自然言語で出来たり便利じゃん
そこまでいってようやく、AIが社会の役に立つと言えるな
そういうの作ってその場で終わりじゃなくて
専ブラ作って提供してよ
AI特化するなら使うし金も払うよ
NGとかも自然言語で出来たり便利じゃん
そこまでいってようやく、AIが社会の役に立つと言えるな
246名無しさん@お腹いっぱい。
2025/02/12(水) 13:53:17.81ID:QB8jkDDB >>242
ヤン・ルカン「強化学習は捨てろ!」
ヤン・ルカン「強化学習は捨てろ!」
2025/02/12(水) 13:55:38.15ID:xVsTw/Z8
今のAIレベルだと、いじってその場で驚いて終わりだから蓄積されないんよね
自分用のパーフェクトアプリみたいな雛形があれば、日々積み上げられる気はするけど
プログラマじゃないとそんなんまだ出来んし
はよ誰か作って
と言いたい所だが、AIの進化を待ってる方が早く出来る、というジレンマ
1年ぐらい気絶したい
自分用のパーフェクトアプリみたいな雛形があれば、日々積み上げられる気はするけど
プログラマじゃないとそんなんまだ出来んし
はよ誰か作って
と言いたい所だが、AIの進化を待ってる方が早く出来る、というジレンマ
1年ぐらい気絶したい
248名無しさん@お腹いっぱい。
2025/02/12(水) 13:59:05.66ID:gcO8qi+N OpenAIが技術レポートだすの久々な気がする
2025/02/12(水) 14:07:01.16ID:i6mWWk5g
2025/02/12(水) 14:09:04.43ID:i6mWWk5g
1年気絶してたらついて行けなくて焦るだけだと思うぞ
251名無しさん@お腹いっぱい。
2025/02/12(水) 14:09:56.19ID:HnS2rVNg https://x.com/i/grok/share/A9kqTD6SUZmMa83bxRPTHcErK
xAIの開発者が、コーディングにおける個人的AIランキングを投稿した
→xAIから、削除か辞職かを迫られる
→辞職
xAIの開発者が、コーディングにおける個人的AIランキングを投稿した
→xAIから、削除か辞職かを迫られる
→辞職
2025/02/12(水) 14:24:05.39ID:xVsTw/Z8
253名無しさん@お腹いっぱい。
2025/02/12(水) 15:32:10.50ID:OkA492lu xのgrokってけっこう煽ってくるよね
254名無しさん@お腹いっぱい。
2025/02/12(水) 15:34:34.90ID:hP7bUSQD2025/02/12(水) 15:41:29.24ID:VPqiyjJl
256名無しさん@お腹いっぱい。
2025/02/12(水) 16:22:03.14ID:CG/Y0uHP257名無しさん@お腹いっぱい。
2025/02/12(水) 16:28:09.19ID:5ClBhDcL2025/02/12(水) 16:32:08.47ID:VPqiyjJl
言うても数学はまだこのレベルやで
asset.watch.impress.co.jp/img/wf/docs/1649/667/image2.png
asset.watch.impress.co.jp/img/wf/docs/1649/667/image2.png
2025/02/12(水) 17:11:49.78ID:2GsHImnK
>>244
Poeのボット化はしてみたが…ビリオネアと何話していいかわからんな
https://poe.com/s/kiPjpE1Sh3paMki2612V
それにこのボットで使ってるGemini-1.5-Flash@Poeのコンテキストウィンドウはかなり小さいので数ターンで破綻する
いろいろ試して面白くなりそうなら別のモデルも検討するが、たぶんダメだろう(ネタ不足で)
>>245
それは専ブラ作ってる人に要望出したほうが早そう
API利用料とかかかりそうなんで無料では無理かもしれんが
Poeのボット化はしてみたが…ビリオネアと何話していいかわからんな
https://poe.com/s/kiPjpE1Sh3paMki2612V
それにこのボットで使ってるGemini-1.5-Flash@Poeのコンテキストウィンドウはかなり小さいので数ターンで破綻する
いろいろ試して面白くなりそうなら別のモデルも検討するが、たぶんダメだろう(ネタ不足で)
>>245
それは専ブラ作ってる人に要望出したほうが早そう
API利用料とかかかりそうなんで無料では無理かもしれんが
2025/02/12(水) 17:36:01.63ID:w1uVnz7o
PerplexityのR1は無料の本家と同じ性能?UI使いやすい?使ってる人どんな感じかな?
2025/02/12(水) 17:49:41.98ID:4nluY5Wz
>>258
FrontierMathなんて本職の数学者でもせいぜいそのくらいでしょ
人間が数時間とか数日、問題によっては数週間かけてやっと解けるレベルの問題群をo3のデフォルトの設定でそんだけ解けるわけだからどう考えてもo3はバケモン
FrontierMathなんて本職の数学者でもせいぜいそのくらいでしょ
人間が数時間とか数日、問題によっては数週間かけてやっと解けるレベルの問題群をo3のデフォルトの設定でそんだけ解けるわけだからどう考えてもo3はバケモン
262名無しさん@お腹いっぱい。
2025/02/12(水) 18:04:45.01ID:WFkH7O2v 無料で試せるんだから使ってみろよw
2025/02/12(水) 18:08:16.57ID:h9C1p7Ex
最近進歩止まってるな 遅すぎる
264名無しさん@お腹いっぱい。
2025/02/12(水) 18:08:41.25ID:HnS2rVNg FrontierMathはTier1-3の難易度で構成されているけど、去年のうちに更に難易度が高いTier4の開発が宣言された
https://x.com/tamaybes/status/1870618481177370678
一方最新の成績では、Tier3を28%含んだ問題セットに対して、o3-mini-highとPython toolで32%まで来ている
https://x.com/Justin_Halford_/status/1885547672108511281
https://x.com/tamaybes/status/1870618481177370678
一方最新の成績では、Tier3を28%含んだ問題セットに対して、o3-mini-highとPython toolで32%まで来ている
https://x.com/Justin_Halford_/status/1885547672108511281
265名無しさん@お腹いっぱい。
2025/02/12(水) 18:12:12.33ID:leqcQ94b 【悲報】o3 miniくんGemini 2.0 proよりハルシネーションが起きやすいことが指摘されてしまう…
s://i.imgur.com/TNTBIAu.jpeg
s://i.imgur.com/PWj5SDM.jpeg
s://i.imgur.com/TNTBIAu.jpeg
s://i.imgur.com/PWj5SDM.jpeg
2025/02/12(水) 18:25:17.34ID:rVQrSgHc
>>260
公式サイト同様にシンキングしてるか不明だけど、
検索で何をソースにしたか一覧が出るのは性能差を感じさせない
しかしPerplexityは、前回の資料を忘れなさ過ぎるから、同じペルソナ設定で違うことさせると、
混じった回答をする恐れがある
公式サイト同様にシンキングしてるか不明だけど、
検索で何をソースにしたか一覧が出るのは性能差を感じさせない
しかしPerplexityは、前回の資料を忘れなさ過ぎるから、同じペルソナ設定で違うことさせると、
混じった回答をする恐れがある
2025/02/12(水) 18:32:03.04ID:rVQrSgHc
Geminiは、なかなか創造性のある回答してくれるけど、
複数の物の違いや共通点について聞くプロンプトだと
頼んでもないのに比較表を作り出して、結局作れず終わるエラーが多すぎる
(あとどうしても倫理が厳し過ぎて、日常にあるグレーまで排除してベスト回答から遠ざかる感がある)
複数の物の違いや共通点について聞くプロンプトだと
頼んでもないのに比較表を作り出して、結局作れず終わるエラーが多すぎる
(あとどうしても倫理が厳し過ぎて、日常にあるグレーまで排除してベスト回答から遠ざかる感がある)
AIが、ハルシって、
きたときには、
ハルシってきた、
、、、
と、書き込む、
用語で、
社会的コンセンサスが、
得られてきた、
というか、スレとして、
定着してきた、
と、いう理解で、
いいのか?
(用語的な問題)
きたときには、
ハルシってきた、
、、、
と、書き込む、
用語で、
社会的コンセンサスが、
得られてきた、
というか、スレとして、
定着してきた、
と、いう理解で、
いいのか?
(用語的な問題)
2025/02/12(水) 18:38:26.57ID:PZm6A844
>>266
ありがとう。PerplexityProにしてみた。本家の方で数百回質問したのでそれと比べてみた。本家の方は同じ質問を数十回繰り返すとなぜか量子論ネタに持っていく傾向があるが、これは今のところそれが起きない。
また何か人格がない機械と話している感じがする。出てくるリストは似ている
ありがとう。PerplexityProにしてみた。本家の方で数百回質問したのでそれと比べてみた。本家の方は同じ質問を数十回繰り返すとなぜか量子論ネタに持っていく傾向があるが、これは今のところそれが起きない。
また何か人格がない機械と話している感じがする。出てくるリストは似ている
270名無しさん@お腹いっぱい。
2025/02/12(水) 18:51:00.54ID:HnS2rVNg ChatGPTのオプションにAdvanced Voiceのオンオフを切り替える項目が追加されている
https://i.imgur.com/JtLQH2p.jpeg
オプション項目化ということは、GPTsにAVMが追加されるのかもしれない
https://i.imgur.com/JtLQH2p.jpeg
オプション項目化ということは、GPTsにAVMが追加されるのかもしれない
■ このスレッドは過去ログ倉庫に格納されています