Nous Research 的 RL 环境黑客松回顾帖!
首先介绍本次活动的明星——获奖者!
主观赛道前三名分别是:
第一名 - Pokemon Trainer,由 @iyajainfinity 和 @AlexReibman 创作
第二名 - VR-CLImax,由 @JakeABoggs 创作
第三名 - DynastAI,由 David van Vliet 和 @SRacoon23 创作
客观赛道前三名分别是:
第一名 - CyberMaxxing,由 @1999_karthik 创作
第二名 - HelpfulDoctors,由 @tsadpbb、Nilesh Shah、Max Phelps 和 Alexander Speicher 创作
第三名 - Physical RL,由 @nullref0 和 @venkatacrc 创作
特别感谢我们的合作伙伴 @xai、@MistralAI、@nvidia、@tensorstax、@akashnet_、@nebiusai、@runpod_io、@daytonaio、@morph_labs、@LambdaAPI 和 @Tesla
以及来自 @arcee_ai、@axolotl_ai、@cursor_ai、@latentspacepod、@MIT、@togethercompute、@haizelabs、@SophontAI、@EdgeAGI、@Google 的众多评委,特别是:
@AlpayAriyak、@winglian、Samuel Barry、@tmm1、@keirp1、@swyx、@Teknium1、@karan4d、Meghana Puvvadi、@arattml、@brianlechthaler、Josh May、Alex Gu、@gordic_aleksa、@AlpayAriyak、@eraqian、@LukePiette、Rohan Rao、@chargoddard、@LoganGrasby、@xennygrimmato_、@zhangir_azerbay、@rogershijin、@max_paperclips、@theemozilla 和 Abhinav Balasubramanian