自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输出一份近乎完美的答案。对于研究人员来说,思考过程的公开可以帮助他们检查模型「在思维链中说过...