中華AIのDeepSeekか。
OpenAIのLLMはおそらく32ビット浮動小数点で単精度浮動総数点と言われているFP32で動いている
最近はその半分のFP16で動かすLLMもある。半分だと32bitのCUDAコア1つが2つ分になる。半分のGPUで同じ推論が可能
DeepSeekはFP6なんだよね、符号1ビット、浮動小数点3ビット、仮数部2ビット
32bitのCUDAコア1個で、同時に5個の推論画が可能だし1個の推論がめちゃくちゃ早い
GPUを1/5に削減できる
アメリカでもFP8で大丈夫か?と言っている段階だったのに
探検
民◯党類ですが皆で引責祭りしませんか
■ このスレッドは過去ログ倉庫に格納されています
637名無し三等兵 警備員[Lv.9][新芽] (アウアウウー Sa47-N+ua)
2025/01/28(火) 10:03:43.48ID:6521KF1oa■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 舛添要一「日本は亡国への道をひた走り」「相対的国力は中国が増大し日本が低下している」 [冬月記者★]
- 従来の健康保険証、12月1日に期限切れ マイナ利用率は37% [蚤の市★]
- 【公明党】派遣型風俗店の女性の裸をスマホで盗撮か 徳島県議会議員の古川広志容疑者逮捕 警視庁 ★2 [nita★]
- 【地方】「もうヤメとけ、また移住者様が帰っちゃうぞ」田舎の「いじめ体質」★3 [七波羅探題★]
- 【あれ?】訪日自粛どこ吹く風 中国からどっと2000人 金沢港に今年最後のクルーズ船 [nita★]
- 【サッカー】J2とJ3が観客数で歴代最多更新 J2は337万人超、J3も142万人超で過去最多「記録ずくめの最終節」 [尺アジ★]
