SmallThinker-3B 是一种轻量级但功能强大的模型,经过 Qwen2.5-3B-Instruct 精细调优,专为资源受限环境和快速高效推理而设计。它基于 QWQ-LONGCOT-500K 数据集,擅长生成结构化推理链,超过 75% 的训练样本超过 8000 个 tokens。
🔹生成 token 速度快 70%
🔹紧凑但强大
🔹理想用于 Edge 和 Draft 应用
🔹开源且透明
我们刚刚发布了一份逐步指南,教你如何在 NodeShift Cloud 或任何其他 GPU 设置上安装和运行 SmallThinker-3B!无论你使用的是 Ollama、Open WebUI 还是 Jupyter Notebook,我们都涵盖了你需要在几分钟内开始的所有内容。
在这里阅读完整博客:https://t.co/sFEbSvf6QE
#smallthinker #AImodel #opensource #Cloud