Phi-1.5のデモをちょっと触ってみたけど
https://replicate.com/lucataco/phi-1.5
規模を考えるとなかなか賢い
https://i.imgur.com/5jR0H6s.png

GPT-4から見た評価
https://chat.openai.com/share/8b4c203e-ab74-4a88-9701-2ccf622cbfc6