Un excellent travail de @JamesTamplin pour aller au-delà des évaluations standard afin de juger les modèles d'IA. Il est surprenant de voir Gemini 2.5 Flash tout détruire dans cette simulation de Minecraft.