@JamesTamplin 的出色工作,超越了标准评估来评判 AI 模型。 令人惊讶的是,Gemini 2.5 Flash 在这个 Minecraft 模拟中表现得如此出色。