Hôm qua, @grass và @inference_net đã phát hành một mô hình chú thích video 12B rẻ hơn 15 lần so với các mô hình đóng và vượt qua hoặc ngang bằng hiệu suất của GPT-4.1 và Claude 4 Sonnet. Thật điên rồ, đặc biệt là khi nó được đào tạo trên 1 triệu khung hình video từ mạng của Grass. Tôi cũng rất hào hứng khi thấy sự sản phẩm hóa của mạng lưới này. Hãy tưởng tượng những mô hình này có thể tốt đến mức nào khi Grass/Inference tiếp tục làm việc cùng nhau và Grass thu thập toàn bộ trạng thái internet để đào tạo các mô hình. Hãy tưởng tượng🌱
Inference
Inference02:02 15 thg 8
Giới thiệu ClipTagger-12b. Một mô hình chú thích video tiên tiến được đào tạo hợp tác với @grass. ClipTagger-12b cung cấp khả năng chú thích video tương đương với Claude 4 và GPT-4.1 với chi phí thấp hơn 17 lần. Tìm hiểu thêm:
5,94K