Gran trabajo de @JamesTamplin para ir más allá de las evaluaciones estándar para juzgar los modelos de IA. Es sorprendente ver cómo Gemini 2.5 Flash arrasa en esta simulación de Minecraft.