【ChatGPT】AIチャット総合 28【Gemini・Claude】

**名無しさん＠お腹いっぱい。** · 2024/12/31(火) 03:17:13.58

Anthropicはo1より前から、<antThinking>タグを使って回答前の思考過程を（ユーザーには表示しないようにして）出力するということをやっている
（<>の代わりに例えば$$を使うように指示すればユーザーも思考過程を見ることができる）
それを発展させて強化学習でトレーニングすれば、推論モデルはすぐ作れそう