跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+14.39%
USELESS
+6.45%
IKUN
+30.89%
gib
+10.21%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.46%
ALON
+8.17%
LAUNCHCOIN
-1.4%
GOONC
+8.66%
KLED
-1.3%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+1.8%
Boopa
+8.41%
PORK
+12.1%
主頁
Andrej Karpathy
建築@EurekaLabsAI。曾任 AI 總監 @ 特斯拉,創始團隊 @ OpenAI,CS231n/PhD @ 史丹佛大學。我喜歡訓練大型深層神經網路。
查看原文
Andrej Karpathy
10 小時前
我昨天透過早期訪問使用了 Gemini 3。幾個想法 - 首先,我通常會對公共基準保持謹慎,因為在我看來,它們很可能被操控。這取決於團隊的紀律和自我克制(同時他們的激勵措施強烈相反),以避免通過對測試集相鄰數據的複雜操作來過度擬合測試集。實際上,因為其他人都在這樣做,這種壓力是很大的。 去和模型對話。和其他模型對話(騎上 LLM 循環 - 每天使用不同的 LLM)。我昨天對個性、寫作、氛圍編碼、幽默等方面有了積極的早期印象,顯示出非常穩定的日常使用潛力,顯然是一個一級 LLM,恭喜團隊! 在接下來的幾天/幾週裡,我最感興趣並在尋找一個針對私人評估的集成,現在很多人/組織似乎都在為自己構建這個,並偶爾在這裡報告。
450.2K
4.15K
Andrej Karpathy
11月18日 08:29
我開始養成閱讀所有內容(部落格、文章、書籍章節等)的習慣,並使用 LLMs。通常第一次閱讀是手動的,然後第二次是「解釋/總結」,第三次是問答。我通常會比直接跳過更深入地理解內容。這正逐漸成為最常見的使用案例之一。 另一方面,如果你是一位作家,試圖解釋/傳達某些事情,我們可能會越來越少看到「我為另一個人寫這個」的心態,而更多的是「我為 LLM 寫這個」。因為一旦 LLM「理解」了,它就可以針對性地、個性化地將這個想法提供給用戶。
842.84K
8.56K
Andrej Karpathy
11月17日 01:56
分享一段有趣的近期對話,討論AI對經濟的影響。 AI被比作各種歷史先例:電力、工業革命等等,我認為最強的類比是將AI視為一種新的計算範式(Software 2.0),因為這兩者根本上都是關於數位信息處理的自動化。 如果你要預測1980年代計算對就業市場的影響,你會關注一項任務/工作的最具預測性的特徵是其算法的固定程度,即你是否只是根據機械的、易於指定的規則(例如打字、記帳、人類計算器等)來機械地轉換信息?在那時,這是當時計算能力所允許我們編寫的程序類別(手動編寫)。 現在有了AI,我們能夠編寫以前無法手動編寫的新程序。我們通過指定目標(例如分類準確性、獎勵函數)來做到這一點,並通過梯度下降搜索程序空間,以找到對該目標表現良好的神經網絡。這是我之前的一篇Software 2.0博客文章。在這種新的編程範式中,新的最具預測性的特徵是可驗證性。如果一項任務/工作是可驗證的,那麼它可以直接或通過強化學習進行優化,並且可以訓練神經網絡以極其良好的效果運作。這是關於AI能在多大程度上“練習”某件事。環境必須是可重置的(你可以開始新的嘗試)、高效的(可以進行很多次嘗試)和可獎勵的(有某種自動化過程來獎勵任何特定的嘗試)。 一項任務/工作越是可驗證,就越容易在新的編程範式中實現自動化。如果它不可驗證,那麼它必須依賴神經網絡的泛化魔法,或者通過模仿等較弱的手段。這就是推動LLMs進展的“鋸齒狀”邊界。可驗證的任務迅速進展,甚至可能超過頂尖專家的能力(例如數學、代碼、觀看視頻的時間、任何看起來像是有正確答案的謎題),而許多其他任務則相形見絀(創造性、策略性、結合現實世界知識、狀態、上下文和常識的任務)。 Software 1.0輕鬆自動化你可以指定的內容。 Software 2.0輕鬆自動化你可以驗證的內容。
1.9M
12.19K
熱門
排行
收藏