DeepSeek es genial.
Básicamente, "balancearon la carga" del modelo.
En términos simples, en lugar de un modelo generalizado sobrecargado, lo han dividido en "expertos" más pequeños que se activan y funcionan de manera más eficiente según lo que se necesite.
Necesitamos un proyecto Manhattan 🇺🇸 para la AGI.