Соберите заметки о новой статье DeepMind "Видеомодели являются нулевыми обучающимися и рассуждающими" - она очень убедительно доказывает, что генеративные видеомодели для задач компьютерного зрения аналогичны тому, как LLM были для задач NLP: единые модели, которые могут решать широкий спектр задач.
@JustinAngel В обоих случаях можно придумать крайние случаи, которые выявляют их ограничения - с LLM может быть так, что эти ограничения будут преодолены по мере улучшения моделей, будет интересно увидеть, произойдет ли это с видео моделями.
20,86K