DeepSeekはクールです。彼らは基本的にモデルを「負荷分散」しました。簡単に言えば、1つの膨張した一般化モデルの代わりに、必要に応じて目覚めてより効率的に動作する小さな「専門家」に分割しました。私たちはAGIのための🇺🇸マンハッタンプロジェクトが必要です。