Meta FAIR 的新研究:代碼世界模型 (CWM),一個 32B 的研究模型 我們鼓勵研究社群研究這個開放權重模型! 對於好奇的人,pass@1 評估: 在 SWE-bench 上 65.8 % 經過驗證 在 LiveCodeBench 上 68.6 % 在 Math-500 上 96.6 % 在 AIME 2024 上 76.0 % 🧵
請查看技術報告、模型權重和代碼: ➡️ 閱讀技術報告: ➡️ 下載開放權重: ➡️ 下載代碼:
查看更多來自 @syhw:
Gabriel Synnaeve
Gabriel Synnaeve9月25日 05:17
(🧵)今天,我們發布了Meta Code World Model(CWM),這是一個擁有320億參數的密集型LLM,能夠通過代理推理和使用世界模型進行計劃來改善代碼生成的研究。
為了澄清一些混淆: 我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情,請參考論文,特別是第 3 頁圖 2 的說明。
@syhw 只是為了澄清一些混淆: 我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情,請參考論文,特別是第 3 頁圖 2 的說明。
504.37K