Вчора я грав у Gemini 3 у ранньому доступі. Декілька думок — По-перше, я зазвичай раджу бути обережним із публічними бенчмарками, бо, на мою думку, їх цілком можливо підіграти. Все зводиться до дисципліни та самостриманості команди (яка, тим часом, сильно заохочується інакше) не перенавантажувати тестові набори через складні гімнастичні вправи над даними, що суміжні з тестовими наборами у просторі вбудовування документа. Реалістично, оскільки всі інші так роблять, тиск на це дуже високий. Іди поговори з моделлю. Спілкуйтеся з іншими моделями (Ride the LLM Cycle — використовуйте новий LLM щодня). Вчора у мене склалося позитивне раннє враження щодо особистості, письма, кодування атмосфери, гумору тощо, дуже солідний потенціал щоденного водія, явно LLM першого рівня, вітаю команду! Протягом наступних кількох днів/тижнів я найбільше зацікавлений і шукаю ансамбль для приватних оцінок, які багато людей/організацій тепер створюють для себе і час від часу пишуть тут.