一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Meta FAIR 的新研究：代码世界模型 (CWM)，一个 32B 的研究模型我们鼓励研究界研究这个开放权重模型！对于好奇的人，pass@1 评估结果：在 SWE-bench 上为 65.8 % 经过验证在 LiveCodeBench 上为 68.6 % 在 Math-500 上为 96.6 % 在 AIME 2024 上为 76.0 % 🧵

请查看技术报告、模型权重和代码： ➡️ 阅读技术报告： ➡️ 下载开放权重： ➡️ 下载代码：

查看更多来自 @syhw:

为了澄清一些混淆：我提供的 SweBench Verified 数字指的是 *TTS* pass@1。这个数字是正确的。有关更多细节，请参阅论文，特别是第 3 页图 2 的说明。

@syhw 为了澄清一些混淆：我提供的 SweBench Verified 数字指的是 *TTS* pass@1。这个数字是正确的。有关更多细节，请参阅论文，特别是第 3 页图 2 的说明。

504.37K