SoSoValue - See the Unseen, Predict Value

总市值:$00

ZH

暗色

搜索SSI/Mag7/Meme/ETF/币种/指数/图表/研报

00:00 / 00:00

分享

crynetio

由AI翻译

🚀 查看 Artificial Analysis 的最新基准测试结果！

- Grok 4 以 73 的 AI 指数领先，击败了 OpenAI o3 (70)、Google Gemini 2.5 Pro (70)、Anthropic Claude 4 Opus (64) 和 DeepSeek R1 0528 (68)。🥇
- 在价格方面，Grok 4 与 Grok 3 的价格相同，为每百万输入/输出 token 3.15 美元（缓存输入为 0.75 美元）。这与 Claude 4 Sonnet 持平，但比 Gemini 2.5 Pro（小于 20 万个 token 为 1.25 美元）和 o3（在最近降价后为 2 美元）更贵。💸
- Grok 不仅在 AI 方面获胜，还在编程和数学指数方面名列前茅！📊📚
- 它的 GPQA Diamond 得分创下了 88% 的记录，超过了 Gemini 之前 84% 的高分！🌟
- 在 Humanity's Last Exam 中，它获得了 24% 的分数，超过了 Gemini 之前的 21% 的记录。温馨提示：我们的基准测试使用 2025 年 1 月份的数据集，不使用任何工具。🧠📝
- 在 MMLU-Pro (87%) 和 AIME 2024 (94%) 中并列最高分。🎉
- Token 输出速度为 75 tokens/秒——低于 o3 (188)、Gemini (142) 和 Claude Sonnet Thinking (85)，但高于 Claude Opus Thinking (66)。⚡️
- 上下文窗口？稳定的 256k 个 token——少于 Gemini 的 100 万个，但仍然优于 Claude 版本和 R1（均为 20 万个或以下）。🪄
- 目前支持文本和图像输入；音频尚未加入。🔊❌
- 函数调用和结构化输出？当然！📞✨

#AI #BenchmarkResults #Grok4

10s 洞悉市场

协议隐私政策白皮书官方验证Cookie博客

sha512-gmb+mMXJiXiv+eWvJ2SAkPYdcx2jn05V/UFSemmQN07Xzi5pn0QhnS09TkRj2IZm/UnUmYV4tRTVwvHiHwY2BQ==

sha512-kYWj302xPe4RCV/dCeCy7bQu1jhBWhkeFeDJid4V8+5qSzhayXq80dsq8c+0s7YFQKiUUIWvHNzduvFJAPANWA==