これだけ色んなモデルが出てきても一般的な文章作成能力だと3 Opusがまだまだ頭一つ抜けて強いのが不思議
複雑な処理になればなるほど他モデルだと命令無視が増える
o1は複雑な長文命令に向いてるモデルじゃないし、GPT-5出ても自然言語処理だと3.5 Opusが強いって結果になると思う