DeepSeek - это интересно.
Они по сути "распределили нагрузку" модели.
Попробую объяснить проще: вместо одного громоздкого обобщенного модели, они разбили её на более мелкие "эксперты", которые активируются и работают более эффективно в зависимости от потребностей.
Нам нужен 🇺🇸 проект Манхэттен для AGI.