总市值:$00
API
ZH
暗色

搜索SSI/Mag7/Meme/ETF/币种/指数/图表/研报
00:00 / 00:00
查看
    市场
    指数
    资讯
    TokenBar®
    分析
    宏观
    观察列表
分享
NousResearch
由AI翻译

Atropos v0.3 现在发布了!

自 v0.2 以来,我们的 RL Environments 框架已经进行了很多升级 - 以下是一些亮点:

- @rogershijin 现在可以将 Atropos 用作基准测试和评估框架,我们推出了第一个外部基准测试 Reward-Bench 2!

- 添加了 Reasoning Gym,这是一个由 @neurosp1ke 和朋友们移植到 atropos 中的外部环境 gym 仓库,包含 100 多个推理任务

- @max_paperclips 集成了 @intern_lm 的推理训练营,为 RL 增加了 1000 多个新的推理任务

- Atropos 的首席工程师 @dmayhem93 添加了数十个错误修复以及其他可靠性和兼容性改进,更好地支持多环境和 CI/CD

- 许多 Atropos 黑客马拉松环境已合并到 /environments/community 中 - 要列出所有这些环境将占用大部分屏幕空间,但以下是一些亮点:

@JakeABoggs 的 VR-CLI、Philosophy RLAIF、Adaptive LLM Teachers、WebVoyager、@hallerite 的蛋白质设计、@gabinfay 的模型路由环境、多个关于精益证明的环境、catbot arena、pokemon showdown、poker、helpful doctors、@khoomeik 的梵语诗歌等等!

- 其他值得注意的官方支持的新环境包括:

Answer format following environment

从 @MatternJustus 的工作中移植的 Pydantic to JSON environment

从 @natolambert 和 @allen_ai 的工作中移植的 Instruction Following

Letter Counting

- 47 位全新的贡献者!

在此处查看完整的更新日志:https://t.co/4mI4ZcnZiS

10s 洞悉市场
协议隐私政策白皮书官方验证Cookie博客
sha512-gmb+mMXJiXiv+eWvJ2SAkPYdcx2jn05V/UFSemmQN07Xzi5pn0QhnS09TkRj2IZm/UnUmYV4tRTVwvHiHwY2BQ==
sha512-kYWj302xPe4RCV/dCeCy7bQu1jhBWhkeFeDJid4V8+5qSzhayXq80dsq8c+0s7YFQKiUUIWvHNzduvFJAPANWA==