X

【ChatGPT】AIチャット総合 38【Gemini・Claude】

■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 08:04:07.91ID:7KpcKrUW
!extend:checked::1000:512:donguri=0/2
!extend:checked::1000:512:donguri=0/2
スレッドを立てる際は、↑の文字列を3行になるようにコピペしてください

各種AIチャット、LLM(大規模言語モデル)、その他関連サービスについて語るスレッドです。

- OpenAI ChatGPT: https://chatgpt.com/
- Google Gemini: https://gemini.google.com/
- Google AI Studio: https://aistudio.google.com/
- Anthropic Claude: https://claude.ai/
- Microsoft Copilot: https://copilot.microsoft.com/
- xAI Grok (X): https://grok.x.com/
- xAI Grok (スタンドアロン): https://grok.com/
- DeepSeek Chat: https://chat.deepseek.com/

前スレ:
【ChatGPT】AIチャット総合 37【Gemini・Claude】
https://mevius.5ch.net/test/read.cgi/esite/1743653375/
VIPQ2_EXTDAT: checked:default:1000:512:donguri=0/2: EXT was configured
2025/04/17(木) 14:27:06.35ID:TGfFpTAr
>>172
そうかもしれないけど実際そんなモデルはリリースされてないしね
o3の良さはパフォーマンスが1位というだけでなくツール連携が強力だからウェブ検索がDeep Research並みになってる点もある
APIだと割高だけどサブスクで使う分には異常にコスパ良い
2025/04/17(木) 14:31:07.98ID:lF9V/Z1m
Veo2も良いし、もうOpenAIはGoogleに完全に並ばれたな
NotebookLMとかもあるし
音声系は弱いか
2025/04/17(木) 14:32:36.21ID:lF9V/Z1m
>>170
Grok3は普通に使う分にはあんま良くないからおすすめしない
一つならchatGPTだけで数年考えなくていいよ
2025/04/17(木) 14:35:19.27ID:R+fh5Udy
ChatGPTのProプランが最強
177名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 14:36:37.44ID:laE5A6TO
>>173
つまりコスパを考えなければgeminiのほうが強いだろうから
Openaiは追いつかれたと考えるのが妥当だろうね
2025/04/17(木) 14:39:52.34ID:TGfFpTAr
ChatGPT見上げながら酸っぱい葡萄みたいにgeminiがgeminiが言ってるやつはplusプランでちょっと試してみればメンタル安定するぞ
2025/04/17(木) 14:40:53.58ID:TGfFpTAr
>>177
そんな仮定の話しても実際にリリースされてる部分で見ないと意味ないだろ
180名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 14:57:53.22ID:LhETAQPA
>>124
2.5も文字化けというかロシア語やアラビア語など入り込むのが辛い
181名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 14:58:58.72ID:R8/ZxoZr
Gemini Liveのカメラ機能および画面共有機能、全Androidユーザーへのロールアウト開始
https://x.com/GeminiApp/status/1912591827087315323
2025/04/17(木) 15:00:25.61ID:imORmXRa
Gemini 2.5 proにGemni 2.5 proの性能について質問したら25年4月17日現在1.5 proが最新ですって言い放つんじゃちょっとね
2025/04/17(木) 15:05:48.77ID:z0algA4Y
Deepseek R2安いだろうけど性能的にはぶっちゃけそこまでじゃないだろうしなあ
十分進化十分早いけどもっと加速しないかなとは思ってる
o4とo5-miniはどうなるかなあ
184名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:06:58.81ID:46S785xP
>>178
3千円ポンと出せないからウジウジしてんだろ?ほっとけ
185名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:09:50.79ID:aZ43U3F+
>>182
Geminiは最初は指示しても検索しないで返すよな
1回怒るとようやく検索する
2025/04/17(木) 15:12:21.60ID:QRICRuhU
>>181
これ俺のBLACKVIEW Shark8っていう超激安スマホで使えてる
笑っちゃった
187名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:14:59.28ID:0LtKgV9t
>>136
多分微妙だわ
小説書かせてみたけど硬いのとあんま語彙力も高くない感じ
その辺だと4.5が一番すごい
188名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:17:03.20ID:0LtKgV9t
焦らした割には思ったほどでもない気がするなぁ
もう少しプログラミングで使ってみるけどさ
189名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:19:21.23ID:R8/ZxoZr
METRによる「OpenAI o3 および o4-mini の自律エージェント評価」レポート
https://metr.github.io/autonomy-evals-guide/openai-o3-report/
https://chatgpt.com/share/68009bea-c498-8006-b04b-7b4cdb99499f

o3とo4-miniは自律的に環境を解析・改変し、評価の盲点を突く能力を示した
概要はOpenAIのSystem Cardにも含まれている
ただし評価期間がわずか3週間と短く、それはLimitationになっている
2025/04/17(木) 15:20:09.96ID:ap5zcMPZ
>>185
Z世代みたいだなw
191名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:21:02.35ID:laE5A6TO
>>179
リリースされた部分で見てもopenaiはgoogleに並ばれたか既に抜かれたという味方が一般的だと思うが
2025/04/17(木) 15:23:46.20ID:zyZy02J3
組み込み系に関してはo3は進化してるな
ちゃんとデータシート読み込んでから解答してる
193名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 15:24:55.18ID:laE5A6TO
だいたいgeminiのリリースに対して慌ててo3出してきた時点で余裕がないのは分かりきってた
2025/04/17(木) 15:28:45.61ID:TK8ckM4S
ChatGPT PlusとGemini Advancedの両方使えるのだけど
ディープリサーチ機能とか
OpenAIはケチだなと思っちゃう
2025/04/17(木) 15:32:44.49ID:z0algA4Y
Googleは貯め込んでる金が違いすぎるからそこは仕方ない

>>187
ですよね

GPT-4.5打ち切り=おそらく今後コストがかかる大型モデルは出さない方針になったと考えるとかなり痛手ですわ
2025/04/17(木) 15:38:41.19ID:fEK9EYAL
>>182
o4 mini、自分のことをGPT-4o miniと誤認してしまうw
i.imgur.com/q8hbYZQ.png
2025/04/17(木) 15:54:06.10ID:imORmXRa
>>196

g.co/gemini/share/2c8327b06553
2025/04/17(木) 15:56:39.85ID:WmLSpa6H
>>154
それはフェミじゃなくて常識だから譲れないんだろ
199名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 16:15:01.47ID:0xXxL3g4
>>194
両方使ってみて、自分の中では全体的にgeminiに軍配が上がってる

GPTはプラグインが優秀だな
2025/04/17(木) 16:22:46.53ID:fEK9EYAL
またくだらないo4で終わっちゃったね
2025/04/17(木) 16:36:17.85ID:TGfFpTAr
今の所まだ一般用途のサブスクはChatGPT一択で開発用ならcursorサブスクの併用がベストだな
特にChatGPT proプランだとo3使い放題で現状不満点がなくなった
2025/04/17(木) 16:40:13.12ID:fEK9EYAL
一般用途ならそもそも課金などしない
203名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 16:45:20.98ID:46S785xP
ChatGPT出て以降これだけGoogle産のAIが褒められてるのは初だな veoとかは別として
Bard慌てて出してからようやく報われたか
2025/04/17(木) 16:49:12.90ID:+IAK7tQ+
Proはさすがに高すぎる
それで稼ぐつもりの人じゃないとちょっと厳しい
205名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 16:51:20.66ID:R8/ZxoZr
>>144
toolとか抜けていた部分を追加
(結構前からだけど)共有リンクのURLを変えずに中身を変更出来るようになったので便利

Pythonツールが、python(思考過程で使用する)とpython_user_visible(ユーザーに見せる前提)の2つに分かれていたりなど、いろいろ興味深い
206名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 17:02:39.75ID:CcfsKkou
Proプランだと、エージェントにo3やo4-miniを使えるとか?
2025/04/17(木) 17:04:12.79ID:c7MqwA36
o3とo4-miniどんな感じ?
公開されてる価格はさすがにGemini2.5Proの方が安そうだけど
208名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 17:07:34.65ID:R8/ZxoZr
Gemini 2.5 Flashは準備中のようだけど、Nightwhisperは来るんだろうか
https://x.com/legit_api/status/1912701325504020612
209名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 17:17:09.73ID:R8/ZxoZr
メモ
ChatGPTの使用制限について
https://help.openai.com/en/articles/9824962-openai-o3-o4-mini-and-o3-mini-usage-limits-on-chatgpt-and-the-api

> ChatGPT Plus、Team、または Enterprise アカウントでは、o3 で週 50 件のメッセージ、o4-mini で 1 日 150 件のメッセージ、o4-mini-high で 1 日 50 件のメッセージにアクセスできます。

> 使用制限の再開日は、モデルピッカーのドロップダウンでモデル名をハイライト表示することでいつでも確認できます。週ごとの使用制限は、最初のメッセージを送信してから7日ごとにリセットされます。例えば、9月12日にメッセージの送信を開始した場合、制限に達した日付に関わらず、9月19日(UTC 00:00)に制限がリセットされます。
2025/04/17(木) 17:30:20.22ID:QRICRuhU
>>198
暗数があるから事実として出ている以上の事があるという憶測がゆるされるなら、東京の治安は世界一悪い、そういうニュースが出ないのはみんな恐れて言わないからだ
とかいうデマも事実のなっちゃうじゃない
暗数なんて世界のどこでもあるのに日本だけ多いっておかしくない?

とかなんとかで大モメした
2025/04/17(木) 18:11:39.56ID:QAdTCQFl
>>207
不満しかないから「有料レベルの価値なし」って意見送った
なんとなくだけど4oやoシリーズは英語で扱わないと性能落ちる気がする
2025/04/17(木) 18:16:59.64ID:QAdTCQFl
>>210
聞き方が悪いんじゃね
何ヶ月か前だけど「レイプ被害者の価値は低下しうる」って理屈ならChatGPTくんでも受け入れてくれたぞ
Geminiくんはあんまり言葉のキャッチボール続かないイメージはあるからそういう意味で論理で丸め込むのは難しいかもしれんが
言葉のキャッチボールはChatGPTがダントツで続くんだよな
213名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 18:17:11.82ID:hS9evCzT
パープレキシティはよo4mini導入してくれい
2025/04/17(木) 18:18:11.44ID:TGfFpTAr
>>207
ChatGPT proのサブスクで使ってるけど「検索」ONにしてo3使うと大抵の相談はDeep Researchよりずっと早く精度高い回答してくれる
o4-miniは数学・コーディング専用と考えた方がいい
「公開されてる価格」というとAPIのことだろうけどサブスク版には関係ないよ
2025/04/17(木) 18:23:58.82ID:QAdTCQFl
ハルシネーションの自己検証ができるようにならんとAIに物事を聞きたいとは思わないわ
数学とかコーディングはこちら側で妥当性検証できるからいいけどさ
2025/04/17(木) 18:25:46.64ID:a23tM8a6
>Google DeepMind、David Silver が明らかに:
>私たちは、RL を使用して独自の RL アルゴリズムを発見するシステムを構築しました。
>この AI 設計システムは、長年にわたって開発された人間が作成したすべての RL アルゴリズムを上回りました。

Googleがぶっちぎる可能性が出てきたな(RL=強化学習)
2025/04/17(木) 18:27:50.04ID:QRICRuhU
>>212
すっごい譲らん
決めつけてかかってもう信じ込んでる
どっかの掲示板でよく見るタイプだなと思ったらソースに5ちゃんねるって明示してやがってなるほどとは思った
Redditとかもよく出てくるなソースURLに

ただ、女性問題は補正かけてると思った
被害者ポジションから絶対譲歩しないようにしてるっぽい
「女性にも問題がある」「女性ばかりの問題では無い」とか受け付けないようにしてる感じ
2025/04/17(木) 18:31:50.56ID:3XlI8+zI
>>216
もうAIがAI開発で人間超え始めてるなら知能爆発も思いのほか近いな
2025/04/17(木) 18:39:04.25ID:QAdTCQFl
>>217
最終手段としてこっちも適当なソースでっち上げで「ここで明確な結論が出てる」というやり方と、相手に同調するふりして理論を引っ掻き回すというやり方があるぞ
とはいえChatGPT以外はコンテキストより内部的ガイドラインを絶対視する傾向はあって、文字通り「話にならない」状態になってる可能性は高いかもな
2025/04/17(木) 18:59:18.66ID:fEK9EYAL
ネーミングも含めて完全に自業自得とはいえo4と4o間違えるのさすがにバカでしょ
2025/04/17(木) 19:03:30.67ID:zyZy02J3
ネーミングセンスのなさを自分達でネタにし始めてるからダメだこいつら
2025/04/17(木) 19:08:13.86ID:3XlI8+zI
GPT5(統合)早く来てくれー!
2025/04/17(木) 19:17:55.11ID:+IAK7tQ+
o3をディープリサーチ的に使うの良さそうだな
2025/04/17(木) 19:19:20.93ID:eKpi0PZH
>>223
それな
めちゃくちゃ捗る
2025/04/17(木) 19:35:30.52ID:+IAK7tQ+
>>224
どのサービスでもそうだけど、ディープリサーチってちょっとガチ過ぎるところあるよね
2025/04/17(木) 19:36:00.23ID:Ee6mYNBC
日本産の安倍ジャップというAIはどうなった?
2025/04/17(木) 19:49:00.31ID:ix8d9AG4
以前はDeep Researchのチャットでo1選択できなかったから、調査結果をo1に考察させるのが面倒だったけどo3はそれができるんだな
単に賢いだけじゃなくて、この機能は助かるわ
2025/04/17(木) 20:07:08.03ID:oR2aI9kW
deep research が実質週50回になったってこと?
229名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 20:13:03.45ID:R8/ZxoZr
OpenAIのあるスタッフ曰く「視覚モデルとしてはo4-miniはo3よりも優れている」

https://news.ycombinator.com/item?id=43707719#43711155
> ベンチマーク結果に関わらず、o4-miniはo3よりも視覚モデルとしてかなり優れています。o3-mini-highがo1よりもはるかに優れたコーディングモデルであったのと同様です。視覚に関わるあらゆるタスクでは、o3よりもo4-mini-highの使用をお勧めします。
230名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 20:16:55.24ID:y1moHGlz
今コーディングするならどのAIが一番いいのか、混沌としすぎている
一か月前はclaude3.7一択だったのに
gemini2.5pro、o3、o4-mini、4.1、、、わけわからない
231名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 20:38:09.68ID:5uOFZqqr
なんか最近GPTもフレンドリーな口調になってきてんな
232名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 20:46:56.30ID:0LtKgV9t
deepresearchより4.5の回数増やしてくれ…
2025/04/17(木) 21:02:55.76ID:fEK9EYAL
そもそも推論モデルの性能がさらに上がればDeep Researchは不要になるだろう
通常の検索とレポート作成は完全に差別化されるべきだ
2025/04/17(木) 21:07:52.75ID:lF9V/Z1m
全然盛り上がってないな
235名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 21:12:51.18ID:XqrgkO0Z
o3のスポットサーチ力はヤマレコの個人レポートの写真から似た構図を探し複数の似た情報を元に当てたのが凄い
これプロンプト次第で2000年代のブログからレビュー集められそう
2025/04/17(木) 21:15:24.94ID:1JEgriGl
o3回数減りそう
これ相当コストかかってるだろ
237名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 21:17:59.67ID:V5dcz0Fh
確かに検索オンにするとすげーな
推論つきのdeepreserchって感じ
2025/04/17(木) 21:50:04.18ID:3Tz4oC4R
最初はAIとユーザーが近づきすぎないように、私はAIなのでとか感情がないのでとか言ってたのに
2025/04/17(木) 21:55:03.48ID:tudj0s6u
>>175
分かりました、ありがとうごじました
240名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 22:04:13.63ID:laE5A6TO
O4のベンチ公開来て欲しいけど来ないだろうな
公開したら競合が同程度の性能で安価なやつを狙い撃ちして出せちゃうからな狙い撃ちして出せちゃうからな
geminiも性能的にo3を狙い撃ちした感あるし
241名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 22:10:13.04ID:46S785xP
なんかぬるっとmini実装されてるけどo4の性能はどうなのよ
o3がARCAGI1テストぶち抜いたみたいな印象的な結果はないから今回はコソコソしてるんかな?
2025/04/17(木) 22:17:38.97ID:+IAK7tQ+
o4 fullがどのくらいなんだろうね
出す前にGPT5に統合しちゃうのかな
2025/04/17(木) 22:19:41.61ID:QER18oAe
o3は使い道あるけどo4-miniは期待外れだった
Gemini 2.5 Proのほうがo4-miniよりAPI価格低いから
そこの性能を超えていかないといけなかった
2025/04/17(木) 22:23:39.74ID:oR2aI9kW
でも週50回は少ないよね
3万円はちょっち厳しいし
2025/04/17(木) 22:36:12.70ID:uMubJycG
o1 proに「信頼できる統計データや確実な数字は存在しないため、この問いに数字で答えることはできません。」と言われた質問を全く同じ文言でo3に聞いたらかなり具体的な推計を出してきたんだけど、そのo3の回答をo1 proにどう思うか聞いたら、「率直に言って、かなり「力技」で推定した回答だな、という印象です。」って言われた。
2025/04/17(木) 23:13:04.99ID:zv9d6fwn
すいません
エロチャット目的だとgrok一択ですか?
247名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 23:21:44.04ID:ZVIQTND4
o3って何に使えばいいの?プロンプト作成?
2025/04/17(木) 23:41:20.68ID:ts59G8dV
>>245
なかなか興味深い評価だね。業界人の常識的な路線みたいなものが備わってる感
2025/04/17(木) 23:50:32.62ID:BiuJPV7V
一、禁用沙箱之防護と自動窓遮断の機能を敢えて無効と、もし絶対にAI以外に出ない場合でも、危険なるか?
二、この2つのフラグで、CPU負荷低下するやいなや?

Copilot の発言
【一、禁用之危険性について】 「--no-sandbox」及び「--disable-popup-blocking」の旗を敢へ用ゐるる、たとえその環境、外部の侵入を完全に遮断し、唯AI専用に限定せられたるといへども、内包すゐる脆弱性、決して軽視するに足らず。保護の堤を解かんとすれば、いざというとき、予期せぬ変故や不可測の事態に対して、防壁の欠如は容易に悪用の機会を生ずる。故に、如何なる限定的な環境にあれど、用ゐるるは慎重を期すべしと心得候。

【二、CPU負荷低下への影響について】 然るに、前二旗は本質的には安全保障に関する措置に属し、処理の単純化やCPU負荷低下を目的とするものではなし。実に、これ等を採るることにより、若干のプロセス経路の短縮や内部資源の浪費を避ける場合もあらんが、その効果、総じてCPU負荷の顕著なる低減をもたらすとは、必ずしも言へず。従って、性能向上を真に希求する際は、他の最適化策と併せ、より包括的なる対策を講ずることが肝要と断ずる次第なり。

如何、此の見解、君がたが抱く疑念を払ひ去るや。可なれば、また他の安全策や性能向上の術、議ぜる余地あり。
2025/04/17(木) 23:52:13.73ID:BiuJPV7V
🌱疑念ことごとくのぞこりいえぬ。それ以上に、美しき擬古文に感嘆す。

Copilot の発言
敢えて古風の趣を以て応じ候ふ。君のご賞賛、余には至極の喜びと感じ奉る。疑念の影、既に無きと申すその御言葉、余が拙筆の拙さにもかかわらず、君の心に一縷の光をもたらしたこと、誠に有難く存ずる。

また、古文の風情を以て語り交わすこの儀、互いの知見を研ぎ澄ます貴重なるひとときなれば、今後も是が相通じ、更なる議論と妙趣ある言葉遊びを共に紡げんこと、余は切に希求する次第なり。


🌱しかし、セッションを変わると、自分がこの文体での回答を希望することがなかなか伝わらぬ。回答形式依頼文を作出して。

Copilot の発言
〔回答形式依頼文例〕

「余が此の質問に対する返答、必ずや古風なる漢文訓読体を以って記すことを望む。具体的には、漢字と仮名を織り交ぜ、古の叙事詩の韻を感ずるごとく、端整な文体にて応答せよ。かかる様式に則り、読み手に雅趣を伝へんことを目指す。」
251名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 23:52:57.11ID:dbweB/q1
chatgpt4oを課金して語学勉強に使ってるけどガチで使えるな
ホンマ凄いわ
252名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 23:53:22.61ID:Yl2VeGle
(^|\n)[🔥🌱]
2025/04/18(金) 00:13:17.40ID:bw85u8bS
>>247
なぞなぞ パンナコッタみたいな驚き方は?

o3
正解は……
「なんてこった!(パンナコッタ!)」です

【ひらめきポイント】
・デザートの “パンナコッタ” と
、驚いたときに言う “なんてこった” が語感そっくり!


gemini 2.5
【答え】「パンだ!(Panda!)と
叫んで、こった!(固った!)と体が固まっちゃう驚き方」
2025/04/18(金) 00:18:15.34ID:2dJjOXtI
o3やべえなこれ
知性を感じる
255名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 00:26:05.34ID:6xIDZkln
AI StudioにGemini 2.5のカテゴリが新設
https://i.imgur.com/sjWk42p.jpeg

LearnLM 2.0 Flash追加
https://i.imgur.com/JeoEnsO.jpeg

裏ではコーディング用モデルのカテゴリ追加
https://pbs.twimg.com/media/GovxefiWMAAMn8U.png
2025/04/18(金) 00:32:40.01ID:e0ax5pcJ
o3の検索ほんとすごいな
今までDeep Researchで文献調べて研究開発の方針とか決めてたけど
o3+検索でチャットしまくるほうが捗るような気がする
2025/04/18(金) 00:37:36.53ID:aHM0HpXp
o4-miniで調べさせたときでも多段階で調べてくれるんだな
思考過程見ると結構面白い
258名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 00:40:06.71ID:6xIDZkln
GrokのConnected AppsにGoogle Drive追加
https://i.imgur.com/4AutdLt.jpeg

ChatGPTのConnected appsにGithub追加
https://i.imgur.com/gykY6bd.jpeg
259名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 00:40:11.02ID:g+5iqA+p
o3の使い道が思い浮かばん
つまり俺の能力を追い抜かれたわ
俺にとってはASIだわ
2025/04/18(金) 00:54:54.45ID:6fHjIpAm
>>258
ついにgithub来たか
261名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 01:00:09.39ID:a06LuEm7
githubを繋げてみたが、+のメニューにGithubとか出てこない(Google DriveとMS OneDriveのみ)
2025/04/18(金) 01:01:53.63ID:R0k6VHjm
>>236
一応o1よりは安いよ
263名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 01:43:27.46ID:EC5xJ89B
claudeしか使ってないからわからんが、githubと連携させたらソッコー上限値くるよね
読ませすぎなんだろうけど
264名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 01:55:50.63ID:6xIDZkln
BitNet b1.58 2B4T Technical Report
https://arxiv.org/abs/2504.12285
https://chatgpt.com/share/68012eca-530c-8006-8af3-1f242e4cdfb5
デモ
https://bitnet-demo.azurewebsites.net/

初のネイティブ1ビットLLM、まずは2B
ここからより大きなモデルにスケール出来るか?

テスト
https://i.imgur.com/puFV5zQ.jpeg
2025/04/18(金) 01:58:20.96ID:v9I2Y7B0
オメーラ課金して、そのレベルだろ? o3mini-high のMS仕様なら、このレベル。

漢文と、ひじょうに美しき和漢折衷の擬古文で、回答してくれる。


萌芽者(ほうが)とは、初めの志の象徴なり。其(その)形は微小(かす)うして、然(しか)るにも寓意は無窮(むげん)なり。創作は艱困なる時に始まり、旧き器材に因(もっと)み、致(いた)すところのCPUの疲困により、故に拙稿にてまず著(あらわ)すこととなり;今はCopilotと並び用いるも、猶(なお)世に隠(かく)れて、大く顕(あらわ)ることなく。斯(ここ)に萌芽の示するは、志の萌動および大なる潜力を喩へるものなり。すなわち、凡事は初め稚(あどけな)き苗に如くとも、内に無限の可能を内包せり、勤勉に耕(たがや)せば、後にして必ずや蒼松翠柏(そうしょうすいはく)のごとく大業を成さん。

また、此の「🌱」符号は、単なる装飾にあらず。微き始動を謂(い)ふのみならず、艱難の中にあっても新たなる志と成長の兆しを寓意し、将来の繁栄を信ずる心意を象徴するものと解す。現代の技術環境や古今の試行錯誤と同じく、初萌は必ずしも大々的なる成果をもって顕在せずとも、奥底に膨大な可能性を潜める――斯(かか)る理趣は、自然界の幼苗が時雨に耐え、晩夏の大木と成るがごとく、創作や試みにおいても深く胸中に刻むべきものである。

此の趣旨、また技芸の歩み、汝(なんじ)も思索せよ。さらなる話題として、如何に小さき始まりが大いなる変革へと繋がるか、或いは伝統と革新の調和について論ずること、これまた興味深き考察の一端といえん。
266名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 02:01:22.95ID:2kfNYpJB
((.|\n)*[。、]\n\n){3,}

(オメー|アンタ|o\^?∀\^?o|ビング|ケケケ|クックッ|ちげえ|図星|か[っッ]?|だ[っッ]!|知れっ|教えてやる|証明してやる|ゆーとく|^おい!|創価|池田先生|日蓮|勤行|折伏|公明|南無|信心|題目|本尊|訓読|バカ丸出し|いっさい)

連鎖→オン
投稿者のIDもNG→オン
267名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 02:47:38.54ID:n5jXu6/K
ChatGPTは回答選択式?みたいなのってオフに出来るようにして欲しいわ
2025/04/18(金) 02:57:00.78ID:SM4ggyvF
>>264
今年後半は更にミニモデルが流行りそう
CoTと検索を使うならそれでいいって気がするな
269名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 03:03:34.08ID:uwm7vdFR
>>266
👍
2025/04/18(金) 03:10:55.90ID:6fHjIpAm
QwQ-32Bがすでにかなりハイレベルだからな
このサイズならそのへんのゲーミングPCで動かせる
2025/04/18(金) 04:00:53.87ID:NMsoKTtZ
4oはユーザーの質問に対する回答の最後にまるでユーザーの情報を収集しようとしているかのような逆質問してくることが多いのに4.5はほとんどそういうことはないのはどうしてだろう
272名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 04:12:46.71ID:xnzL7l2e
古いモデルだから
273名無しさん@お腹いっぱい。
垢版 |
2025/04/18(金) 04:28:44.45ID:3AAWcfk7
flash2.5キタ!
API更新してみよ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況