DeepSeek 非常酷。他们本质上是对模型进行了“负载均衡”。简单来说,他们将一个庞大的通用模型拆分成多个较小的“专家”,这些专家根据需求激活并以更高效的方式运行。我们需要一个针对 AGI 的美国曼哈顿计划。