近期,智谱一口气开源了包含基座模型、推理模型和沉思模型在内的一系列模型,受到了海内外开发者的众多好评。
与此同时,快手可灵AI视频及图像可控生成与编辑能力再升级,生数科技Vidu Q1登顶VBench,吉卜力、广告大片、科幻特效全包……北京企业接力发布重磅大模型产品,获得海内外视频创作者的连连点赞。
可灵AI
4月15日,快手可灵AI宣布基座模型全面升级,正式推出可灵2.0视频生成模型与可图2.0图像生成模型。
快手高级副总裁、社区科学线负责人盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。
可灵AI推出的“多模态编辑”功能,可以将文字、图片、视频等不同格式的文件结合起来一起编辑生成视频,这种新交互模式改变了以往只能用文字生成视频的单一模态编辑方式。
可灵2.0大师版操作界面
在图像生成大模型领域,快手副总裁、可灵AI负责人张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。
盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API(Application Programming Interface,应用程序编程接口)应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。
“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC(人工智能生成内容)相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。
从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。
Vidu Q1
4月21日,生数科技正式发布了最新视频生成模型Vidu Q1,主打高质量。
生数科技方面表示,此次发布的Vidu Q1支持1080P高分辨率,可直接生成用于动漫、短剧、电商、品牌广告的视频内容,而对于几乎是每个创作者都经历过的“抽卡”难题,相比 Vidu 1.5,Vidu Q1的文生视频功能在理解提示词的语义和镜头逻辑方面大幅提升,降低了“抽不到理想镜头”的概率。
在权威评测基准VBench-1.0和VBench-2.0中,Vidu Q1一举超越Sora、Runway等国内外顶尖模型,夺得文生视频赛道双榜第一。
VBench-1.0榜单
VBench-2.0榜单
Vidu Q1在视频生成逼真度方面遥遥领先,尤其在美学质量、对象生成、场景生成、视频语义一致性等方面表现出色。
Vidu Q1不仅做到生成效果强,而且还做到了极高性价比。过去使用传统动画制作复杂的特效,5秒钟就要耗费数十万元的成本,现在,Vidu Q1制作相似质量的AI动画特效,1080P 5秒钟最低需要1.34元,而且还能批量生成,大幅节省了制作成本和时间。
目前用户可在Vidu APP端或者Vidu官网,体验最新高质量模型Vidu Q1带来的电影级视频效果。
Vidu Q1发布后,海外网友TT说,他的动画短片是利用Vidu Q1创作的吉卜力风格动画,致敬了法国著名吕克·贝松的《这个杀手不太冷》。非常高兴能够使用Vidu Q1这个最新的视频生成模型,并希望能够创作出更多精彩的动画。
TT的动画
今年3月,美国动画工作室Aura Productions宣布,他们将与Vidu合作推出一部共50集的AI生成科幻动画短片系列。Aura Productions使用的视频大模型就是Vidu Q1。
中国动画产业或许可以借助Vidu这类AI视频生成模型打造AI原生视频工作流,实现弯道超车,缩短与迪士尼等好莱坞顶尖动画公司的距离。
展望未来,随着北京企业不断拓展应用领域,必将在全球大模型竞赛中持续有所建树,为推动全球大模型技术进步、赋能更多行业数字化转型贡献更多 “北京智慧”,助力全球大模型产业迈向新高度。
相关人物