SmallThinker-3B 是一種輕量級但功能強大的模型,經過 Qwen2.5-3B-Instruct 精細調優,專爲資源受限環境和快速高效推理而設計。它基於 QWQ-LONGCOT-500K 數據集,擅長生成結構化推理鏈,超過 75% 的訓練樣本超過 8000 個 tokens。
🔹生成 token 速度快 70%
🔹緊湊但強大
🔹理想用於 Edge 和 Draft 應用
🔹開源且透明
我們剛剛發佈了一份逐步指南,教你如何在 NodeShift Cloud 或任何其他 GPU 設置上安裝和運行 SmallThinker-3B!無論你使用的是 Ollama、Open WebUI 還是 Jupyter Notebook,我們都涵蓋了你需要在幾分鐘內開始的所有內容。
在這裏閱讀完整博客:https://t.co/sFEbSvf6QE
#smallthinker #AImodel #opensource #Cloud