发布时间:2026-01-29
信息来源:国际科技创新中心微信公众号
字体:
大
中
小
打印
发布时间:2026-01-29
信息来源:国际科技创新中心微信公众号
1月27日,北京人工智能创新企业月之暗面正式发布了新一代开源模型——Kimi K2.5。

该模型基于万亿参数混合专家(MoE)架构,采用15万亿视觉与文本混合Token进行原生多模态训练,在Agent智能体、代码生成、视觉理解等领域实现重要进展。相关评测数据显示,其多项成绩达到或超过GPT-5.2、Claude Opus 4.5等国际主流闭源模型,体现了北京在通用人工智能领域的持续创新能力。

Kimi K2.5在代码生成方面实现了功能与视觉设计的结合。该模型引入“视觉即代码”开发方式,可根据界面截图或录屏视频自动解析交互逻辑,并生成相应前端代码,支持动态布局、滚动触发等交互效果。用户可通过圈选等方式在截图上标注修改意图,模型可据此进行调整,提升了开发效率。
在自主决策能力方面,Kimi K2.5在HLE,BrowseComp等Agent相关评测中取得当前开源模型中的较好结果。这一突破得益于K2.5原创的“Agent智能体集群”架构。区别于传统单体AI的串行处理模式,K2.5采用横向扩展策略,可动态调度最多100个专业子Agent并行作战,支持1500次工具调用。在跨领域市场调研、多语种文献翻译、复杂财务建模等场景中,任务执行效率较单一Agent模式提升4.5倍以上。任务分配与拆解由模型自主完成,无需预先设置工作流程。
在视觉理解领域,K2.5模型支持直接处理视频内容,能够识别动作逻辑与视觉信息,可用于视频分析与智能剪辑等场景。在性能相当的情况下,K2.5的运行成本仅为GPT-5.2-xhigh的几分之一。在软件开发领域,该模型的视觉与代码结合能力有助于降低前端开发门槛,非专业用户也能通过自然语言或视觉交互创建高品质网页应用。在办公自动化领域,K2.5深度掌握Word、Excel、PPT等全系列办公软件,可独立完成从3万字论文转制PPT到复杂财务模型搭建的高难度任务。在创意产业领域,K2.5的审美级代码生成能力有望催生新一代"氛围编程"工具,让创意表达不再受限于技术壁垒。
目前,Kimi K2.5已全面上线kimi.com、Kimi App、Kimi API开放平台及编程助手产品Kimi Code,开发者可通过终端直接调用或集成至VSCode、Cursor等主流开发环境。
下一步,市科委、中关村管委会将继续支持相关创新主体开展大模型及智能体技术研发,推动技术应用与产业落地,培育人工智能领域创新企业集群。
相关人物