阿里雲證實,斯坦福大學和華盛頓大學的研究團隊在李飛飛的帶領下,使用阿里通義千問(Qwen)模型爲基礎,訓練了一個名爲s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSeek的R1等前沿推理模型相當,甚至在競賽數學問題上比o1-preview高出27%。訓練過程使用了16個H100 GPU,耗時26分鐘,雲計算費用不到50美元。