DeepSeek - это интересно.

Они по сути "распределили нагрузку" модели.

Попробую объяснить проще: вместо одного громоздкого обобщенного модели, они разбили её на более мелкие "эксперты", которые активируются и работают более эффективно в зависимости от потребностей.

Нам нужен 🇺🇸 проект Манхэттен для AGI.