最近,大模型领域一再上演“北京时刻”!
智谱AI开源模型、快手可灵2.0、生数科技Vidu Q1、智源研究院大型开源文本数据集CCI 4.0接连发布,企业、科研机构的密集动作,不仅展现了北京在AI大模型领域的领跑姿态,更揭示了“技术突破-政策赋能-生态协同”的创新闭环如何在这片土地上生根发芽。
1 智源研究院CCI 4.0
“CCI 4.0兼顾多样性与高质量,从单一语言数据集扩展为多语种数据集。”
2025年5月6日,智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0,为全球的大模型创新发展再次提供重要的开源资源,并积极推动全球开源合作。
本次发布包括了中文、英语两种语言,并将在随后的发布中,开源更多语言的版本。
此外,CCI 4.0首次采用CoT(全称为思维链,是一种推理策略)方法进行推理轨迹数据合成,以提升预训练模型的基础推理能力。CCI 4.0数据集由智源研究院牵头,联合包括面壁智能、美团、月之暗面、紫东太初、中科闻歌等多个机构共同贡献。
此次开源的CCI 4.0-M2-V1包括3个子数据集,总token(模型处理文本时的最小单元)数量达425B(4250亿),比当前全球最大的开源合成数据集Cosmopedia(一个由Hugging Face社区开发的庞大开放合成数据集,旨在支持大语言模型的预训练)规模提升近20倍。针对不同来源的数据,CCI 4.0在建设过程中采取了去重、质量分类、QA合成(通过技术手段自动生成高质量的问答数据)、loss(指预测结果与实际结果之间的差距)过滤的处理原则,数据集中的英文语料、中文语料及合成数据对模型训练效率及性能均有有效提升。
未来,智源研究院将持续开展高质量数据的开源建设工作,不断提升数据集质量,扩展语言和内容覆盖度,增加数据集的领域支持,助力全球大模型的开源创新和人工智能的产业发展。
2 生数科技Vidu Q1
“生数科技全新视频大模型Vidu Q1官宣全球上线!”
“电影级高清画质、首尾帧更全能、动画风格更惊艳,上线AI音效功能,一句话就能生成精准专属音效……”生数科技内部工作人员称。
4月21日上线的Vidu Q1在“极致高质量”上进行了全面升级,支持 1080P 高分辨率,可直接生成用于动漫、短剧、电商、品牌广告的视频内容,实现“即生成、即商用”,将进一步加速AI视频商业化落地。
下面,我们一起来看看它的超能力。
(高清,各种细节处理非常到位,使用相同的提示词再次生成,一致性保持得相当好)
(仅需两张图,实现百万运镜转场)
(动画特效对角色师和动作指导的要求极高,Q1 就是一位 24 小时“角色师”和“艺术指导”)
Vidu Q1在VBench系列的两个榜单上拿下文生视频赛道榜单双第一,不仅被国内动画人喜欢,在日本也迅速走红。“只要掌握了方法,谁都可以使用它。也就是说,即使是那些过去放弃梦想的人,也有可能成为顶尖的创作者。”来自日本的电影编剧、导演和田利用Vidu Q1圆自己的动画梦,他成立了AI动漫内容平台PocketAnime,联合全球的创作者,共同推动AI动漫的发展。
“Vidu Q1不仅做到效果强,而且还做到了极高性价比。过去使用传统动画制作复杂的特效,5秒钟就要耗费数十万元的成本,现在,Vidu Q1制作相似质量的AI动画特效,按照官方的标准版套餐计算,一段5秒1080P的素材成本不到3块钱,而且还能批量生成,大幅节省了制作成本和时间。”上述人士总结道。
以Vidu Q1为代表的视频大模型也在海内外刮起了AI动画旋风,不仅生成效果惊艳,而且还降低了动画制作的门槛,提高了制作效率,削减高昂的人力和制作成本。在业内人士看来,AI动画的热潮才刚刚开始,Vidu视频大模型迭代的脚步不会停下。
3 快手可灵2.0
“今天我非常激动地宣布可灵AI全系模型正式进入2.0时代。”
在4月15日发布会上,快手可灵AI宣布基座模型再次升级。“相比于之前版本,可灵 2.0视频生成模型拥有更强的语义响应、更优的动态质量和更好的画面美学,可灵希望让每个人都能用AI讲出好故事,实现更加精准的复杂创意表达。”快手高级副总裁、社区科学线负责人盖坤表示。
那么可灵2.0效果到底怎么样?我们一起来体验一下。
(大幅度运动,画面也丝毫没受影响)
(捕捉男子从开心到愤怒的情感转变,运镜自然过渡)
(响应影视级别的画面描述,极具大片质感)
“从2024年可灵AI1.0——全球首个用户可用的DIT架构的大模型发布,我们便知整个视频生成技术是一个长跑,也知道这个赛道将会非常激烈。所以发布后可灵AI就进入了‘夺命狂奔’模式。”盖坤感慨地说。
10个月、20次迭代,记录了快手可灵AI团队的速度和效率。目前可灵AI有超过2200万用户使用,这些用户已经在可灵AI的平台上创作了1.68亿个视频和3.4亿张图片。
可灵AI还积极搭建产学研平台:与CCF联合创办大模型探索者基金, 促进学术界与工业界的深度合作;联合清华大学影视传播研究中心共同推出《AI影像创作者手册》,与创作者一起探索AI影像发展的技术进路和实用方法;启动首个AIGC导演共创计划高校巡展,助力高校培养出更多具有创新精神和实践能力的高素质人才;第十五届北影节AIGC单元,多个奖项的获奖作品,均使用可灵AI作为主要创作工具……让灵感成真,让想象成为影像,每个有创意的人都能成为导演,可灵AI开启了个人创作的新篇章。
4 智谱AI三款模型开源
“2025年是智谱AI的开源年。”
4月14日,智谱集中开源GLM-Z1-Air、GLM-Z1-Air、GLM-Z1-Rumination三款模型,涵盖基座模型、推理模型和沉思模型,并且本次开源的系列模型已在智谱的新域名z.ai上开放C端体验。
智谱AI总裁王绍兰介绍说,智谱正在积极探索沉思模型,沉思代表着问题是开放性的,没有标准答案,这要求模型反复思考,与环境频繁交互,最终获得结果。同时,他也介绍了智谱的模型开源地图,成立近六年来,智谱已开源55款模型,在国际开源社区累计下载量近4000万次。他称,智谱将继续推动大模型技术创新,促进大模型开源生态的整体繁荣。
从智谱AI最新开源的系列模型到智源研究院开源的通用向量模型BGE、面壁智能开源的轻量高性能端侧模型MiniCPM等,都是模型开发方面的最新开源成果,也代表了北京“打造全球开源之都”的坚实实践。
5 北京AI创新密码
重磅成果接连发布,技术突破与商业化成果刷屏。这背后,不仅是企业技术实力的爆发,更映射出北京作为“中国AI第一城”的生态优势。
这里有政策“及时雨”。早在2023年5月,北京市科委、中关村管委会发布《北京市促进通用人工智能创新发展的若干措施》,公布了“开展大模型创新算法及关键技术研究”等21项措施,在全国城市中率先打响大模型第一枪。
这里有高校的“人才池”。北京集聚全国AI顶尖学者,清华、北大等高校成为大模型“技术母体”,新型研发机构智源研究院被称为AI界的“黄埔军校”。生数科技由于清华大学人工智能研究院朱军教授团队成立,智谱AI的核心团队主要从清华大学 KEG(知识工程)实验室走出,CEO(首席执行官)张鹏和总裁王绍兰则同为清华创新领军工程博士,快手可灵AI团队业主要来自清华、中科大等高校,体现“学术-产业”人才流动的良性循环。
这里有场景的“试验田”。北京密集的产业场景为大模型提供练兵场,生数科技Vidu打入影视制作,快手可灵AI助力电商及创意营销……多元场景促进技术迭代,形成“需求-研发-应用”正循环。
北京AI相关企业数量约2400家,约占全国一半,已通过备案上线的大模型数量达132款,全国第一。高校的科研基因提供“从0到1”的突破,政策保障促进“从1到10”的规模化,开源与产业协同实现“从10到N”的生态扩张。当全球AI竞争进入深水区,北京正以“硬核创新+柔性生态”的组合拳,书写中国AI的新叙事。正如可灵AI的Slogan:“让每个人都能用AI讲好故事”,这座城市的AI创新故事,才刚刚开始!
北京将继续高举“人工智能第一城”之旗,让现象级产品不断涌现,让AI新质生产力不断澎湃!
相关人物