總市值:$00
API
TC
暗色

搜尋SSI/Mag7/Meme/ETF/幣種/指數/圖表/研報
00:00 / 00:00
查看
    市場
    指數
    資訊
    TokenBar®
    分析
    宏觀
    觀察列表
分享
NousResearch
由AI翻譯

Atropos v0.3 現在已發布!

自 v0.2 以來,我們的 RL Environments 框架已經進行了許多升級 - 以下是一些重點:

- 現在 @rogershijin 可以使用 Atropos 作為基準測試和評估框架,並提供我們的第一個外部基準測試 Reward-Bench 2!

- 新增了 Reasoning Gym,這是一個由 @neurosp1ke 及其朋友們移植到 atropos 的外部環境 gym 儲存庫,其中包含 100 多個推理任務

- @max_paperclips 整合了 @intern_lm 的推理訓練營,為 RL 新增了 1000 多個推理任務

- Atropos 的首席工程師 @dmayhem93 新增了數十個錯誤修復和其他可靠性和相容性改進,更好地支援多環境和 CI/CD

- 許多 Atropos 黑客松環境已合併到 /environments/community 中 - 要列出所有這些環境將佔用大部分螢幕空間,但以下是一些重點:

@JakeABoggs 的 VR-CLI、Philosophy RLAIF、Adaptive LLM Teachers、WebVoyager、@hallerite 的蛋白質設計、@gabinfay 的模型路由環境、多個關於精實證明的環境、catbot arena、pokemon showdown、poker、helpful doctors、@khoomeik 的梵文詩等等!

- 其他值得注意的官方支援的新環境包括:

Answer format following environment

從 @MatternJustus 的工作中移植的 Pydantic to JSON environment

從 @natolambert 和 @allen_ai 的工作中移植的 Instruction Following

Letter Counting

- 47 位全新的貢獻者!

在此處查看完整的變更日誌:https://t.co/4mI4ZcnZiS

10s 洞悉市場
協定隱私政策白皮書官方驗證Cookie部落格
sha512-gmb+mMXJiXiv+eWvJ2SAkPYdcx2jn05V/UFSemmQN07Xzi5pn0QhnS09TkRj2IZm/UnUmYV4tRTVwvHiHwY2BQ==
sha512-kYWj302xPe4RCV/dCeCy7bQu1jhBWhkeFeDJid4V8+5qSzhayXq80dsq8c+0s7YFQKiUUIWvHNzduvFJAPANWA==