热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我昨天通过早期访问体验了Gemini 3。几点想法 -
首先,我通常会对公共基准保持谨慎,因为在我看来,它们很可能被操控。关键在于团队的纪律和自我克制(与此同时,他们的激励机制却是相反的),以避免通过对测试集相邻数据进行复杂的操作来过拟合测试集。实际上,由于其他人都在这样做,施加的压力很大。
去和模型对话。与其他模型对话(骑上LLM周期 - 每天使用不同的LLM)。我昨天对个性、写作、氛围编码、幽默等方面有了积极的早期印象,显然是一个非常稳健的日常驱动者,显然是一个一流的LLM,恭喜团队!
在接下来的几天/几周里,我最感兴趣并在关注的是关于私人评估的集成,很多人/组织现在似乎都在为自己构建这些,并偶尔在这里报告。
热门
排行
收藏

