Meta FAIR 的新研究:代码世界模型 (CWM),一个 32B 的研究模型 我们鼓励研究界研究这个开放权重模型! 对于好奇的人,pass@1 评估结果: 在 SWE-bench 上为 65.8 % 经过验证 在 LiveCodeBench 上为 68.6 % 在 Math-500 上为 96.6 % 在 AIME 2024 上为 76.0 % 🧵
请查看技术报告、模型权重和代码: ➡️ 阅读技术报告: ➡️ 下载开放权重: ➡️ 下载代码:
查看更多来自 @syhw:
Gabriel Synnaeve
Gabriel Synnaeve9月25日 05:17
(🧵)今天,我们发布了Meta Code World Model(CWM),这是一个320亿参数的密集型LLM,能够通过代理推理和使用世界模型进行规划,推动代码生成的创新研究。
为了澄清一些混淆: 我提供的 SweBench Verified 数字指的是 *TTS* pass@1。这个数字是正确的。有关更多细节,请参阅论文,特别是第 3 页图 2 的说明。
@syhw 为了澄清一些混淆: 我提供的 SweBench Verified 数字指的是 *TTS* pass@1。这个数字是正确的。有关更多细节,请参阅论文,特别是第 3 页图 2 的说明。
504.37K