视频理解模型似乎接近拐点。
237