Nous savons que cela n'est pas faisable à long terme du côté de l'énergie et aussi du côté de l'approvisionnement en calcul. Mes calculs approximatifs sur les 20k GPU H100 requis pour @grok. ➤ Énergie GPU H100 ⟶ 20k x 0,7 kW/GPU x 24 heures ⟶ 336 MWh/j ⟶ 122 640 MWh/an ➤ Coûts énergétiques totaux ⟶ 26 880 $/j et 9,81 M$ par an ➤ Investissements totaux (GPUs) ⟶ 600 M$ ➤ Empreinte carbone ⟶ 47 216 tonnes de CO2/an ou 236 082 tonnes de CO2/an L'utilisation de GPU décentralisés qui exploitent le matériel inactif dans le monde entier peut réduire considérablement les coûts, en particulier en termes d'investissements initiaux et de frais généraux. Cette stratégie peut également entraîner une réduction de la consommation d'énergie, une meilleure efficacité des coûts et une empreinte carbone plus faible, potentiellement soutenue par des initiatives écologiques de la part des fournisseurs ou de l'infrastructure décentralisée elle-même. Cependant, l'infrastructure décentralisée en est encore à ses débuts et doit résoudre les lacunes en matière d'efficacité et de performance. Comme l'a noté @mtorygreen, une fois ces défis résolus, revenir à une infrastructure centralisée et héritée pourrait ne plus être sensé. C'est partout ou nulle part.
Elon Musk
Elon Musk16 août, 12:55
J'essaie le nouvel algorithme 𝕏 alimenté par Grok 4 Mini. C'est définitivement mieux. Il faudra environ 20 000 GPU pour le déployer à tous les utilisateurs et il y a une latence plus élevée, mais le jeu en vaut la chandelle.
3,83K