Na minha opinião, a conclusão mais importante desse resultado é que nosso modelo de ouro da Olimpíada Internacional de Matemática @OpenAI (IMO) também é nosso melhor modelo de codificação competitivo. 🧵
Sheryl Hsu
Sheryl Hsu12 de ago., 02:00
1/n Estou emocionado em compartilhar que nosso sistema de raciocínio @OpenAI obteve pontuação alta o suficiente para alcançar o ouro 🥇🥇 em uma das principais competições de programação do mundo - a Olimpíada Internacional de Informática (IOI) de 2025 - ficando em primeiro lugar entre os participantes da IA! 👨‍💻👨‍💻
Após a IMO, executamos avaliações completas no modelo ouro da IMO e descobrimos que, além da matemática competitiva, também era nosso melhor modelo em muitas outras áreas, incluindo codificação. Então, as pessoas decidiram pegar exatamente o mesmo modelo de ouro IMO, sem nenhuma alteração, e usá-lo no sistema para IOI.
O andaime IOI envolveu amostragem de alguns modelos diferentes e, em seguida, usando outro modelo e uma heurística para selecionar soluções para submissão. Este sistema alcançou uma medalha de ouro, ficando em 6º lugar entre os humanos. O modelo de ouro IMO realmente se saiu melhor de todos os modelos que amostramos.
Para ser claro, este sistema usava andaimes, embora um andaime mais leve do que no ano passado. Ele apenas decidiu quais amostras de modelos de uso geral enviar. Estou otimista de que no próximo ano nos sentiremos confiantes de que o modelo em si pode fazer melhor do que qualquer andaime que possamos criar.
Eu não estava envolvido neste trabalho. Parabéns a @sherylhsu02, @alexwei_, @bminaiev e oleg murk, bem como @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky e muitos outros por este resultado!
155,85K