https://x.com/rao2z/status/1715800819239678013
LLMが自己批評と反復によって精度を改善することができるという従来からの説は本当か?外部の検証者による批評の方が精度の向上に寄与するのではないか?という主張
・自己批評は実際にはパフォーマンスを低下させる。
・外部の検証者からのフィードバックはパフォーマンスを向上させる。