NVIDIA vừa công bố Nemotron Nano 4B, một mô hình 4,3 tỷ tham số được tối ưu hóa cho việc suy luận tại rìa mạng
Điều này cho phép AI hoạt động theo thời gian thực mà không cần đến đám mây để xử lý. Tại 375ai, chúng tôi đang xây dựng cơ sở hạ tầng giúp các mô hình này chạy tại rìa mạng
Đọc blog của họ để biết thêm 👇 https://t.co/ThtH9bYajl