在大型推理模型(LRMs)领域,OpenAI的o1模型因其在解决复杂问题方面的卓越能力而备受瞩目。在此基础上,Marco-o1作为一款新兴的LRM,不仅强调数学和编程等传统学科,还优先考虑跨领域的开放式问题解决能力。Marco-o1的核心目标之一是探索o1模型在缺乏明确标准和可量化奖励的领域中,如何