您现在的位置：首页 > 科技动态 > 科技热点

探路智能之源

发布时间：2026-05-07

信息来源：北京日报字体：大中小

打印

发布时间：2026-05-07

信息来源：北京日报

人工智能，正以前所未有的力量重塑经济社会面貌与产业格局。在全力打造“AI第一城”的北京，实验室的方寸之地，成为科技竞争的最前沿、技术跃迁的策源地。这里远离喧嚣，却进行着最激烈的思想交锋；这里不求速成，却孕育着改变未来的力量。

即日起，本报推出《走进实验室》栏目，深入这座城市的AI创新腹地，看新型研发机构如何深入技术的“无人区”，看机器如何真正理解物理世界，看创新种子如何破土抽芽长成参天大树。

在北京，有这样一家新型研发机构——它的科研人员平均年龄仅30岁，却孕育出了中国最早的大语言模型；它不追逐热门赛道，却孵化出一批明星AI公司；它不考核科研人员的论文发表量，却诞生了一个个全国乃至全球“首创”。当很多人发问“中国AI往哪走”时，北京智源人工智能研究院（简称智源研究院），正给出答案。

源头处“破冰”

今年2月，一则令人振奋的消息传来：智源研究院的多模态大模型成果，首次登上国际顶级学术期刊《自然》正刊。谁是智源？故事的起点，在2018年的春天。

一场由横跨产业界、高校以及研究机构的顶尖专家参与的会议上，“最强大脑”们围绕一个问题展开热烈讨论：北京在人工智能方面已积累了人才、科研、产业方面的优势地位，如何在“跟得很好、用得很好”的基础上，做出更多突破性研究，拿出更多引领国际潮流的创新贡献？

智源研究院应运而生。“智源”二字，寓意“人工智能的源头”，正如新型研发机构所承载的使命——从源头引领创新。

也是2018年，《北京市支持建设世界一流新型研发机构实施办法（试行）》印发。“自主确定研究方向、自主选聘科研团队、自主安排科研经费、自主决定科技成果转化……”智源研究院院长王仲远感慨，“行政不干预技术”的理念，在当时堪称“天才”。

经过周密分析与筹备，2020年10月，智源将首个攻坚方向确定为——大模型。100余位不同院校、机构的技术人员聚到一起，向着中文超大预训练模型“无人区”发起冲击。

动则一鸣惊人。2021年3月，仅5个月后，我国首个超大规模信息智能模型悟道1.0问世；3个月后，迭代至悟道2.0，1.75万亿的参数创下全球最大预训练模型纪录。

“火车向左走，城铁向右走，不动的便是五道口。”不论晨昏，地铁13号线腾空向五道口站而来，载来人流，也摆渡梦想。“悟道”之名，正是科学家们独特的浪漫——取自“五道口”的谐音，既是对这片创新热土的致敬，也寄托着中国人工智能走向广阔天地的期许。中国大模型时代的序幕就此拉开。

探路“无人区”

走自主创新，要勇于顶着压力前行。

2024年初，当ChatGPT引爆全球，国内企业纷纷下场做大语言模型时，智源却做出了一个看似“反常”的决定——关停大语言模型相关项目，将其交棒给所孵化的企业继续迭代，转而聚焦在多模态与世界模型等下一代大模型的研发上。

“做高校做不了、企业不愿意做的事。”王仲远道出选择的初衷。何为企业不愿意做的事？是指那些技术路径尚未收敛、充满不确定性、需要长期投入的基础研究，也就是，前沿技术的“无人区”。

人工智能的“无人区”在哪？长期以来，AI系统在学习不同类型的“感官”信息时，往往需要“分科而治”——理解文字用一套方法，生成图片用另一套，处理视频又需要不同的专业模型，过程复杂且协同配合起来较为困难。能否从底层构建一个能够同时理解语言、图像、声音等物理规律的统一模型？

这是一条尚未获得证明的颠覆性路线，但在智源团队看来，也是一条值得探索的前沿技术路线。同年，智源开始布局“原生多模态”大模型。数月后，Emu3发布。

“用一句话概括，Emu3最核心的优势是，它用一种极其简单、统一的架构，实现了对文本、图像、视频等多种信息的理解和生成。”王仲远解释，与当时主流方案需要将擅长理解的语言模型和擅长生成的扩散模型等“拼装”在一起不同的是，Emu3仅使用一个模型，遵循一个最基础的学习原则：“预测下一个词元（token）”。这就如同给AI打造了一套“万能学习法”，无论是文本的下一个词，还是图像、视频的下一个视觉片段，都用同一个“大脑”来处理。

全国首个脑科学多模态通用基础模型、全国首个高精度生命智能模拟平台、全球首个视觉通用分割模型、全球首个生成式多模态大模型、全球最强具身大脑大模型……七年多时间，从智源诞生出一个个首创，背后是一次次颠覆与突破。

“灯塔”再出发

在机器人餐吧里，千寻机器人负责糖葫芦穿串，好饮科技的咖啡机制作咖啡，乐博空间的机械臂调制果茶饮品，银河通用机器人递送糕点，乐聚双臂机器人则将制作好的餐品自主导航送到客人手中。

这样颇具科幻感的一幕，出现在今年3月的北京，2026中关村论坛年会主会场。让不同“出身”的机器人能够像一支训练有素的团队一样默契配合，靠的是一套“跨本体机器人大脑操作系统”在调度指挥——智源研究院的RoboBrain 2.0具身大脑与RoboOS 2.0协作平台。该系统打破了不同厂商、多类型机器人本体的协作壁垒，实现从“单体智能”到“群体智能”的跨越。

人工智能技术发展一日千里，如何迅速抓住新技术的“窗口期”？王仲远的答案是：“土壤，比一两个项目的得失更重要。”

“人工智能时代的创新，已经不是单点突破，而是需要数据、算力、算法、工程、评测等多团队协同作战。”王仲远说，人工智能领域的科研组织，既需要“企业式”的组织效率，又需要“高校式”的探索自由，而这正是新型研发机构的独特之处——既能集中力量干大事，又能充分激发个体创新活力。

在这里，科研人员不唯论文、不唯职称、不唯学历，也不设具体的量化考核任务。在这里，鼓励青年人才挑大梁，有充分的试错空间，如Emu3研发团队的带头人年仅29岁。在这里，某个项目启动时，不用写厚厚的“本子”做项目论证与层层审批，院务会一旦认定方向有价值，资源立刻到位。这种“敏捷科研”的模式，让智源能在学界尚未形成共识、企业逡巡难行的“无人区”率先落子。

创新的火种，从这里点燃，也在这里延续。

1月8日上午9点30分，港交所交易大厅内掌声响起，智谱AI正式挂牌上市，成为“全球大模型第一股”。智谱首席科学家，正是在智源牵头“悟道”项目的清华大学教授唐杰。此外，月之暗面创始人杨植麟、面壁智能联合创始人刘知远、银河通用创始人王鹤……一位位青年科学家从智源走向产业一线，成长为创业者，智源也因此被人们称为AI界的“黄埔军校”。

截至目前，智源已累计孵化智谱AI、月之暗面、面壁智能、银河通用、星源智、脉冲视觉、深言科技等20余家具有核心技术能力的人工智能创新企业，其中上市企业1家，估值超百亿的2家，超十亿的4家。这家年轻的新型研发机构用脚踏实地证明：当机制激活创新、让年轻人挑大梁，中国AI不仅能“跟跑”“并跑”，更能在下一代技术浪潮中成为“领跑者”，闯出一片新天地。

如今，智源又将目光投向了更远的未来。“我们认为，接下来真正需要全球共同突破的科研最前沿，是世界模型。”王仲远说，一如既往地，智源希望能够为中国AI指明技术方向、打牢基础底座、引领行业发展，成为那座照亮前路的“灯塔”。