Foresight News 消息，去中心化 AI 协议 Prime Intellect 发布推理堆栈预览。推理堆栈旨在解决自回归解码中的计算利用率挑战、KV 缓存内存瓶颈及公共网络延迟问题。其采用管道并行设计，支持高计算密度和异步执行。同时 Prime Intellect 发布三款开源代码库：PRIME-IROH（点对点通信后端）、PRIME-VLLM（支持公共网络管道并行的 vLLM 集成）和 PRIME-PIPELINE（研究沙盒）。用户可利用 3090/4090 等 GPU 运行大模型。

Prime Intellect 发布去中心化推理堆栈预览