O muncă excelentă a @JamesTamplin pentru a trece dincolo de evaluările standard pentru a judeca modelele AI. Surprinzător să vezi Gemini 2.5 Flash obliterat în această simulare minecraft.