🎉Поздравляем команду @Zai_org с запуском GLM-4.6V и GLM-4.6V-Flash — с поддержкой day-0 в vLLM Recipes для команд, которые хотят запускать их на своих собственных GPU. GLM-4.6V сосредоточен на высококачественном многомодальном рассуждении с длинным контекстом и нативным вызовом инструментов/функций, в то время как GLM-4.6V-Flash — это 9B вариант, настроенный на более низкую задержку и меньший объем развертывания; наш новый vLLM Recipe поставляется с готовыми к запуску конфигурациями, многопроцессорным руководством и настройками, ориентированными на производство. Если вы разрабатываете сервисы вывода и хотите включить GLM-4.6V в свой стек, начните здесь: