SmallThinker-3B là một mô hình nhẹ nhưng mạnh mẽ, được tinh chỉnh từ Qwen2.5-3B-Instruct, được thiết kế đặc biệt cho các môi trường hạn chế tài nguyên và khả năng suy luận nhanh, hiệu quả. Được xây dựng dựa trên tập dữ liệu QWQ-LONGCOT-500K, nó xuất sắc trong việc tạo ra các chuỗi suy luận có cấu trúc, với hơn 75% mẫu huấn luyện của nó vượt quá 8K token.
🔹Tốc độ tạo token nhanh hơn 70%
🔹Nhỏ gọn nhưng mạnh mẽ
🔹Lý tưởng cho các ứng dụng Edge & Draft
🔹Mã nguồn mở & Minh bạch
Chúng tôi vừa phát hành hướng dẫn từng bước về cách cài đặt và chạy SmallThinker-3B trên NodeShift Cloud hoặc bất kỳ thiết lập GPU nào khác! Dù bạn đang sử dụng Ollama, Open WebUI hay Jupyter Notebook, chúng tôi đã tổng hợp mọi thứ bạn cần để bắt đầu chỉ trong vài phút.
Đọc toàn bộ blog tại đây: https://t.co/sFEbSvf6QE
#smallthinker #AImodel #opensource #Cloud