您现在的位置：首页 > 科技动态 > 新闻聚焦

重磅发布接连不断，北京AI现象级产品诞生的背后

发布时间：2025-05-12

信息来源：创新创业中关村微信公众号字体：大中小

打印

发布时间：2025-05-12

信息来源：创新创业中关村微信公众号

最近，大模型领域一再上演“北京时刻”！

智谱AI开源模型、快手可灵2.0、生数科技Vidu Q1、智源研究院大型开源文本数据集CCI 4.0接连发布，企业、科研机构的密集动作，不仅展现了北京在AI大模型领域的领跑姿态，更揭示了“技术突破-政策赋能-生态协同”的创新闭环如何在这片土地上生根发芽。

1 智源研究院CCI 4.0

“CCI 4.0兼顾多样性与高质量，从单一语言数据集扩展为多语种数据集。”

2025年5月6日，智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0，为全球的大模型创新发展再次提供重要的开源资源，并积极推动全球开源合作。

本次发布包括了中文、英语两种语言，并将在随后的发布中，开源更多语言的版本。

此外，CCI 4.0首次采用CoT（全称为思维链，是一种推理策略）方法进行推理轨迹数据合成，以提升预训练模型的基础推理能力。CCI 4.0数据集由智源研究院牵头，联合包括面壁智能、美团、月之暗面、紫东太初、中科闻歌等多个机构共同贡献。

此次开源的CCI 4.0-M2-V1包括3个子数据集，总token（模型处理文本时的最小单元）数量达425B（4250亿），比当前全球最大的开源合成数据集Cosmopedia（一个由Hugging Face社区开发的庞大开放合成数据集，旨在支持大语言模型的预训练）规模提升近20倍。针对不同来源的数据，CCI 4.0在建设过程中采取了去重、质量分类、QA合成（通过技术手段自动生成高质量的问答数据）、loss（指预测结果与实际结果之间的差距）过滤的处理原则，数据集中的英文语料、中文语料及合成数据对模型训练效率及性能均有有效提升。

未来，智源研究院将持续开展高质量数据的开源建设工作，不断提升数据集质量，扩展语言和内容覆盖度，增加数据集的领域支持，助力全球大模型的开源创新和人工智能的产业发展。

2 生数科技Vidu Q1

“生数科技全新视频大模型Vidu Q1官宣全球上线！”

“电影级高清画质、首尾帧更全能、动画风格更惊艳，上线AI音效功能，一句话就能生成精准专属音效……”生数科技内部工作人员称。

4月21日上线的Vidu Q1在“极致高质量”上进行了全面升级，支持 1080P 高分辨率，可直接生成用于动漫、短剧、电商、品牌广告的视频内容，实现“即生成、即商用”，将进一步加速AI视频商业化落地。

下面，我们一起来看看它的超能力。

（高清，各种细节处理非常到位，使用相同的提示词再次生成，一致性保持得相当好）

（仅需两张图，实现百万运镜转场）

（动画特效对角色师和动作指导的要求极高，Q1 就是一位 24 小时“角色师”和“艺术指导”）

Vidu Q1在VBench系列的两个榜单上拿下文生视频赛道榜单双第一，不仅被国内动画人喜欢，在日本也迅速走红。“只要掌握了方法，谁都可以使用它。也就是说，即使是那些过去放弃梦想的人，也有可能成为顶尖的创作者。”来自日本的电影编剧、导演和田利用Vidu Q1圆自己的动画梦，他成立了AI动漫内容平台PocketAnime，联合全球的创作者，共同推动AI动漫的发展。

“Vidu Q1不仅做到效果强，而且还做到了极高性价比。过去使用传统动画制作复杂的特效，5秒钟就要耗费数十万元的成本，现在，Vidu Q1制作相似质量的AI动画特效，按照官方的标准版套餐计算，一段5秒1080P的素材成本不到3块钱，而且还能批量生成，大幅节省了制作成本和时间。”上述人士总结道。

以Vidu Q1为代表的视频大模型也在海内外刮起了AI动画旋风，不仅生成效果惊艳，而且还降低了动画制作的门槛，提高了制作效率，削减高昂的人力和制作成本。在业内人士看来，AI动画的热潮才刚刚开始，Vidu视频大模型迭代的脚步不会停下。

3 快手可灵2.0

“今天我非常激动地宣布可灵AI全系模型正式进入2.0时代。”

在4月15日发布会上，快手可灵AI宣布基座模型再次升级。“相比于之前版本，可灵 2.0视频生成模型拥有更强的语义响应、更优的动态质量和更好的画面美学，可灵希望让每个人都能用AI讲出好故事，实现更加精准的复杂创意表达。”快手高级副总裁、社区科学线负责人盖坤表示。

那么可灵2.0效果到底怎么样？我们一起来体验一下。

（大幅度运动，画面也丝毫没受影响）

（捕捉男子从开心到愤怒的情感转变，运镜自然过渡）

（响应影视级别的画面描述，极具大片质感）

“从2024年可灵AI1.0——全球首个用户可用的DIT架构的大模型发布，我们便知整个视频生成技术是一个长跑，也知道这个赛道将会非常激烈。所以发布后可灵AI就进入了‘夺命狂奔’模式。”盖坤感慨地说。

10个月、20次迭代，记录了快手可灵AI团队的速度和效率。目前可灵AI有超过2200万用户使用，这些用户已经在可灵AI的平台上创作了1.68亿个视频和3.4亿张图片。

可灵AI还积极搭建产学研平台：与CCF联合创办大模型探索者基金，促进学术界与工业界的深度合作；联合清华大学影视传播研究中心共同推出《AI影像创作者手册》，与创作者一起探索AI影像发展的技术进路和实用方法；启动首个AIGC导演共创计划高校巡展，助力高校培养出更多具有创新精神和实践能力的高素质人才；第十五届北影节AIGC单元，多个奖项的获奖作品，均使用可灵AI作为主要创作工具……让灵感成真，让想象成为影像，每个有创意的人都能成为导演，可灵AI开启了个人创作的新篇章。

4 智谱AI三款模型开源

“2025年是智谱AI的开源年。”

4月14日，智谱集中开源GLM-Z1-Air、GLM-Z1-Air、GLM-Z1-Rumination三款模型，涵盖基座模型、推理模型和沉思模型，并且本次开源的系列模型已在智谱的新域名z.ai上开放C端体验。

智谱AI总裁王绍兰介绍说，智谱正在积极探索沉思模型，沉思代表着问题是开放性的，没有标准答案，这要求模型反复思考，与环境频繁交互，最终获得结果。同时，他也介绍了智谱的模型开源地图，成立近六年来，智谱已开源55款模型，在国际开源社区累计下载量近4000万次。他称，智谱将继续推动大模型技术创新，促进大模型开源生态的整体繁荣。

从智谱AI最新开源的系列模型到智源研究院开源的通用向量模型BGE、面壁智能开源的轻量高性能端侧模型MiniCPM等，都是模型开发方面的最新开源成果，也代表了北京“打造全球开源之都”的坚实实践。

5 北京AI创新密码

重磅成果接连发布，技术突破与商业化成果刷屏。这背后，不仅是企业技术实力的爆发，更映射出北京作为“中国AI第一城”的生态优势。

这里有政策“及时雨”。早在2023年5月，北京市科委、中关村管委会发布《北京市促进通用人工智能创新发展的若干措施》，公布了“开展大模型创新算法及关键技术研究”等21项措施，在全国城市中率先打响大模型第一枪。

这里有高校的“人才池”。北京集聚全国AI顶尖学者，清华、北大等高校成为大模型“技术母体”，新型研发机构智源研究院被称为AI界的“黄埔军校”。生数科技由于清华大学人工智能研究院朱军教授团队成立，智谱AI的核心团队主要从清华大学 KEG（知识工程）实验室走出，CEO（首席执行官）张鹏和总裁王绍兰则同为清华创新领军工程博士，快手可灵AI团队业主要来自清华、中科大等高校，体现“学术-产业”人才流动的良性循环。

这里有场景的“试验田”。北京密集的产业场景为大模型提供练兵场，生数科技Vidu打入影视制作，快手可灵AI助力电商及创意营销……多元场景促进技术迭代，形成“需求-研发-应用”正循环。

北京AI相关企业数量约2400家，约占全国一半，已通过备案上线的大模型数量达132款，全国第一。高校的科研基因提供“从0到1”的突破，政策保障促进“从1到10”的规模化，开源与产业协同实现“从10到N”的生态扩张。当全球AI竞争进入深水区，北京正以“硬核创新+柔性生态”的组合拳，书写中国AI的新叙事。正如可灵AI的Slogan：“让每个人都能用AI讲好故事”，这座城市的AI创新故事，才刚刚开始！

北京将继续高举“人工智能第一城”之旗，让现象级产品不断涌现，让AI新质生产力不断澎湃！