Foresight News 消息,去中心化 AI 协议 Prime Intellect 发布推理堆栈预览。推理堆栈旨在解决自回归解码中的计算利用率挑战、KV 缓存内存瓶颈及公共网络延迟问题。其采用管道并行设计,支持高计算密度和异步执行。同时 Prime Intellect 发布三款开源代码库:PRIME-IROH(点对点通信后端)、PRIME-VLLM(支持公共网络管道并行的 vLLM 集成)和 PRIME-PIPELINE(研究沙盒)。用户可利用 3090/4090 等 GPU 运行大模型。