有沒有想過我們的聊天機器人如何在沒有中央伺服器的情況下,在幾秒鐘內回覆?它運行在 Parallax 的 Swarm 上:一個完全去中心化的網狀網路,您的提示會被代幣化、分段,並路由到持有模型分片的節點上。每個節點執行其分配的 LLM 層,並將隱藏狀態向前傳遞,直到完整的推論完成。最佳節點是根據可用性、計算能力和延遲來選擇的。協調透過 DHT 以點對點的方式進行,從而實現高效的路由、自我修復和容錯能力。去中心化推論本應如此。