Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Am jucat cu Gemini 3 ieri prin early access. Câteva gânduri -
În primul rând, de obicei recomand prudență la benchmark-urile publice, pentru că, după părerea mea, pot fi destul de posibile de jucat. Totul ține de disciplină și autocontrol al echipei (care, între timp, este puternic stimulat în rest) să nu supraajusteze seturile de teste prin gimnastică elaborată peste date adiacente setului de testare din spațiul de încorporare al documentelor. Realist vorbind, pentru că toți ceilalți fac asta, presiunea de a face asta este mare.
Du-te și vorbește cu modelul. Vorbește cu celelalte modele (Ride the LLM Cycle - folosește un LLM diferit în fiecare zi). Ieri am avut o impresie pozitivă de la început în ceea ce privește personalitatea, scrisul, programarea vibrațională, umorul etc., potențial foarte solid pentru mașini zilnice, clar un LLM de nivel 1, felicitări echipei!
În următoarele zile/săptămâni, sunt cel mai curios și caut un ansamblu în locul evaluărilor private, pe care mulți oameni/organizații par acum să-l construiască singuri și să relateze ocazional aici.
Limită superioară
Clasament
Favorite

