@JamesTamplin 的出色工作,超越了標準評估來評判 AI 模型。 令人驚訝的是,Gemini 2.5 Flash 在這個 Minecraft 模擬中表現得如此出色。