SmallThinker-3B é um modelo leve, mas poderoso, ajustado a partir do Qwen2.5-3B-Instruct, projetado especificamente para ambientes com recursos limitados e raciocínio rápido e eficiente. Baseado no conjunto de dados QWQ-LONGCOT-500K, ele se destaca na geração de cadeias de raciocínio estruturadas, com mais de 75% de suas amostras de treinamento excedendo 8K tokens.
🔹70% mais rápido na geração de tokens
🔹Compacto, mas poderoso
🔹Ideal para aplicações Edge e Draft
🔹Código aberto e transparente
Acabamos de liberar um guia passo a passo sobre como instalar e executar o SmallThinker-3B na NodeShift Cloud ou em qualquer outra configuração de GPU! Seja você um usuário do Ollama, Open WebUI ou Jupyter Notebook, cobrimos tudo o que você precisa para começar em poucos minutos.
Leia o blog completo aqui: https://t.co/sFEbSvf6QE
#smallthinker #AImodel #opensource #Cloud