一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Meta FAIR 的新研究：代碼世界模型 (CWM)，一個 32B 的研究模型我們鼓勵研究社群研究這個開放權重模型！對於好奇的人，pass@1 評估：在 SWE-bench 上 65.8 % 經過驗證在 LiveCodeBench 上 68.6 % 在 Math-500 上 96.6 % 在 AIME 2024 上 76.0 % 🧵

請查看技術報告、模型權重和代碼： ➡️ 閱讀技術報告： ➡️ 下載開放權重： ➡️ 下載代碼：

查看更多來自 @syhw:

為了澄清一些混淆：我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情，請參考論文，特別是第 3 頁圖 2 的說明。

@syhw 只是為了澄清一些混淆：我提供的 SweBench Verified 數字是指 *TTS* pass@1。這個數字是正確的。欲了解更多詳情，請參考論文，特別是第 3 頁圖 2 的說明。

504.37K