ベンチマークで推論モデル超える性能ではないてのは伝わってくるけど
俺の日常用途としてはむしろ4.5の対話性能はかなり気になってるわ
つか非推論で知識面最強なら,これベースにo4とか作ればより強くなりそうだな