Gran trabajo de @JamesTamplin para ir más allá de las evaluaciones estándar para juzgar los modelos de IA. Sorprendente ver a Gemini 2.5 Flash arrasar en esta simulación de Minecraft.