Общ. рыноч. кап.:$00
API
RU
Тёмный

ПоискSSI/Mag7/Meme/ETF/Монета/Индекс/Графики/Исследования
00:00 / 00:00
Вид
    Рынки
    Индексы
    Лента
    TokenBar®
    Анализ
    Макрос
    Список наблюдения
Поделится
crynetio

🚀 Ознакомьтесь с последними результатами бенчмарков от Artificial Analysis!

- Grok 4 лидирует с индексом AI 73, опережая OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) и DeepSeek R1 0528 (68). 🥇
- Что касается цены, Grok 4 соответствует Grok 3 — 3,15 $ за миллион входных/выходных токенов (0,75 $ за кэшированный ввод). Это наравне с Claude 4 Sonnet, но дороже, чем Gemini 2.5 Pro (1,25 $ за <200k токенов) и o3 (2 $ после недавнего снижения цены). 💸
- Grok лидирует не только в AI; он также возглавляет индексы программирования и математики! 📊📚
- Он достиг рекордного показателя GPQA Diamond в 88%, превзойдя предыдущий максимум Gemini в 84%! 🌟
- В Humanity's Last Exam он набрал 24%, побив предыдущий рекорд Gemini в 21%. Напоминаем: в наших бенчмарках используются данные за январь 2025 года без каких-либо инструментов. 🧠📝
- Разделил первое место по баллам в MMLU-Pro (87%) и AIME 2024 (94%). 🎉
- Скорость вывода токенов составляет 75 токенов/сек — медленнее, чем у o3 (188), Gemini (142) и Claude Sonnet Thinking (85), но быстрее, чем у Claude Opus Thinking (66). ⚡️
- Контекстное окно? Солидные 256k токенов — меньше, чем миллион у Gemini, но все же лучше, чем у версий Claude и R1 (все на уровне 200k или ниже). 🪄
- Поддерживает ввод текста и изображений на данный момент; аудио пока не поддерживается. 🔊❌
- Функциональные вызовы и структурированный вывод? Еще бы! 📞✨

#AI #BenchmarkResults #Grok4

Все, что вам нужно знать за 10 секунд
УсловияПолитика конфиденциальностиБелая книгаОфициальная проверкаCookieБлог
sha512-gmb+mMXJiXiv+eWvJ2SAkPYdcx2jn05V/UFSemmQN07Xzi5pn0QhnS09TkRj2IZm/UnUmYV4tRTVwvHiHwY2BQ==
sha512-kYWj302xPe4RCV/dCeCy7bQu1jhBWhkeFeDJid4V8+5qSzhayXq80dsq8c+0s7YFQKiUUIWvHNzduvFJAPANWA==