总市值:$00
API
ZH
暗色

搜索SSI/Mag7/Meme/ETF/币种/指数/图表/研报
00:00 / 00:00
查看
    市场
    指数
    资讯
    TokenBar®
    分析
    宏观
    观察列表
分享
crynetio
由AI翻译

🚀 查看 Artificial Analysis 的最新基准测试结果!

- Grok 4 以 73 的 AI 指数领先,击败了 OpenAI o3 (70)、Google Gemini 2.5 Pro (70)、Anthropic Claude 4 Opus (64) 和 DeepSeek R1 0528 (68)。🥇
- 在价格方面,Grok 4 与 Grok 3 的价格相同,为每百万输入/输出 token 3.15 美元(缓存输入为 0.75 美元)。这与 Claude 4 Sonnet 持平,但比 Gemini 2.5 Pro(小于 20 万个 token 为 1.25 美元)和 o3(在最近降价后为 2 美元)更贵。💸
- Grok 不仅在 AI 方面获胜,还在编程和数学指数方面名列前茅!📊📚
- 它的 GPQA Diamond 得分创下了 88% 的记录,超过了 Gemini 之前 84% 的高分!🌟
- 在 Humanity's Last Exam 中,它获得了 24% 的分数,超过了 Gemini 之前的 21% 的记录。温馨提示:我们的基准测试使用 2025 年 1 月份的数据集,不使用任何工具。🧠📝
- 在 MMLU-Pro (87%) 和 AIME 2024 (94%) 中并列最高分。🎉
- Token 输出速度为 75 tokens/秒——低于 o3 (188)、Gemini (142) 和 Claude Sonnet Thinking (85),但高于 Claude Opus Thinking (66)。⚡️
- 上下文窗口?稳定的 256k 个 token——少于 Gemini 的 100 万个,但仍然优于 Claude 版本和 R1(均为 20 万个或以下)。🪄
- 目前支持文本和图像输入;音频尚未加入。🔊❌
- 函数调用和结构化输出?当然!📞✨

#AI #BenchmarkResults #Grok4

10s 洞悉市场
协议隐私政策白皮书官方验证Cookie博客
sha512-gmb+mMXJiXiv+eWvJ2SAkPYdcx2jn05V/UFSemmQN07Xzi5pn0QhnS09TkRj2IZm/UnUmYV4tRTVwvHiHwY2BQ==
sha512-kYWj302xPe4RCV/dCeCy7bQu1jhBWhkeFeDJid4V8+5qSzhayXq80dsq8c+0s7YFQKiUUIWvHNzduvFJAPANWA==