中華AIのDeepSeekか。
OpenAIのLLMはおそらく32ビット浮動小数点で単精度浮動総数点と言われているFP32で動いている
最近はその半分のFP16で動かすLLMもある。半分だと32bitのCUDAコア1つが2つ分になる。半分のGPUで同じ推論が可能
DeepSeekはFP6なんだよね、符号1ビット、浮動小数点3ビット、仮数部2ビット
32bitのCUDAコア1個で、同時に5個の推論画が可能だし1個の推論がめちゃくちゃ早い
GPUを1/5に削減できる
アメリカでもFP8で大丈夫か?と言っている段階だったのに
民◯党類ですが皆で引責祭りしませんか
■ このスレッドは過去ログ倉庫に格納されています
637名無し三等兵 警備員[Lv.9][新芽] (アウアウウー Sa47-N+ua)
2025/01/28(火) 10:03:43.48ID:6521KF1oa■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 河野太郎氏「オフレコでの発言を了解も取らずに報道する姿勢が大きな問題」官邸幹部核発言報道に★2 [♪♪♪★]
- 「刑務所よりひどい」"切り身1切れ"の小学校給食に保護者絶句 給食無償化でさらなる予算削減も ★3 [少考さん★]
- 【テレ朝】「報ステ」大越健介キャスター「オフレコ発言ですが報道すべきと判断しました」 官邸高官が核保有発言 ★2 [少考さん★]
- 漫画「こちら葛飾区亀有公園前派出所」連載開始50周年記念新アニメプロジェクト始動!アニメ『新こちら葛飾区亀有公園前派出所』制作決定 [Anonymous★]
- 公衆トイレで80代男性に性的暴行か 中国籍の男を逮捕・大分 [♪♪♪★]
- 【おこめ】コメ価格は「損切り」間近か 卸最大手・神明社長の「暴落」発言の真意とは 「5キロ3500円」は実現するか [ぐれ★]
- 高市早苗がピョンピョンしたときにハテナブロックから出てきそうなもの [441978185]
- 【実況】博衣こよりのえちえちドラクエ1&2リメイク🧪★6
- すまん「タンク山⛰」ってなんや❓🤔🏡
- 日本人、ついに一線を越える。台湾人留学生のマンションに「日本から出て行け」と貼り紙をはりゴミを撒き散らす [271912485]
- トランプ「エプスタインを完全開示する」→ほぼ全てが黒塗りwww 高市早苗「晋さん、生きていたんだね」 [175344491]
- オレンジを絞ってくれる系自販機、ガチでエグかった…終わりだよこの国 [329329848]
