"Grok 5 pode acabar sendo quase perfeito no Último Exame da Humanidade e provavelmente apontar erros na pergunta. Até Grok 4, que já é primitivo neste ponto, recebeu, acho, 52% excluindo as perguntas visuais." Um tal Elon Musk