阿里云证实,斯坦福大学和华盛顿大学的研究团队在李飞飞的带领下,使用阿里通义千问(Qwen)模型为基础,训练了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等前沿推理模型相当,甚至在竞赛数学问题上比o1-preview高出27%。训练过程使用了16个H100 GPU,耗时26分钟,云计算费用不到50美元。