>>99
最近流行りのChatGPTのような大規模言語モデルの推論は半精度どころか4bitでかまわないという…