如果你的代理無法反思,它就無法進步。重試相同的步驟並非學習。 我們正在試驗記憶體系統,以幫助代理分析失敗、調整並隨著時間成長,而不僅僅是重複循環。觀看我們測試學習的真正面貌。 https://t.co/tfxjeHGlKU